Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
Социальные онлайн-сети, в частности, самая популярная российская сеть "ВКонтакте", являются источником большого количества доступной информации о пользователях благодаря политике открытости данных. Это дает исследователям возможность изучения топологии сетей взаимодействий, возникающих в о...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Russian Public Opinion Research Center (VCIOM)
2018-07-01
|
Series: | Monitoring Obŝestvennogo Mneniâ: Ekonomičeskie i Socialʹnye Peremeny |
Subjects: | |
Online Access: | https://monitoringjournal.ru/index.php/monitoring/article/view/208 |
id |
doaj-d2ef753b70354dcfacbae1fd4a2b4712 |
---|---|
record_format |
Article |
spelling |
doaj-d2ef753b70354dcfacbae1fd4a2b47122020-11-25T00:26:09ZengRussian Public Opinion Research Center (VCIOM)Monitoring Obŝestvennogo Mneniâ: Ekonomičeskie i Socialʹnye Peremeny2219-54672018-07-013787810.14515/monitoring.2018.3.05208Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователейAdelia D. KAVEEVA0Konstantin E. GURIN1Казанский федеральный университетКорпорация «Центр»Социальные онлайн-сети, в частности, самая популярная российская сеть "ВКонтакте", являются источником большого количества доступной информации о пользователях благодаря политике открытости данных. Это дает исследователям возможность изучения топологии сетей взаимодействий, возникающих в онлайн-среде, с применением сетевого подхода (social network analysis). Однако личные данные, которые пользователи сообщают о себе в публичных профилях, зачастую неполны: люди могут по невниманию или умышленно пропускать заполнение тех полей в профиле, которые отражают их пол, возраст, город проживания и другие персональные данные. Эти характеристики играют большую роль при построении социальных сетей в качестве атрибутов "узлов" (то есть пользователей), что позволяет выделять кластеры схожих между собой агентов и их паттерны поведения. Отсутствие некоторых данных может существенно влиять на сетевые метрики (например, размер сети, среднюю длину пути между двумя участниками, распределение числа связей между ними и другие) и искажать полученные результаты. В связи с этим возникает потребность в восполнении пропущенной части данных. В статье представлен опыт создания и применения классификатора, который позволяет определить, является ли пользователь сети "ВКонтакте", не указавший в профиле место жительства, жителем конкретного города. Классификатор был создан и апробирован на примере сети пользователей из г. Ижевска. Он основан на методе дерева решений, которое поэтапно фильтрует аккаунты через ряд вопросов, а затем принимает решение, считать ли данный аккаунт профилем ижевчанина или нет. В статье объяснен выбор основных показателей, которые помогают классификатору определить город пользователя; описан алгоритм работы классификатора и показано, как изменяется топология сети, когда в нее добавляются пропущенные данные о городе проживания пользователей.https://monitoringjournal.ru/index.php/monitoring/article/view/208анализ социальных сетейонлайн-сообществаВКонтактетопология сетейбольшие данныеанализ данных в Rсетевая гомофилияпропущенные данные |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Adelia D. KAVEEVA Konstantin E. GURIN |
spellingShingle |
Adelia D. KAVEEVA Konstantin E. GURIN Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей Monitoring Obŝestvennogo Mneniâ: Ekonomičeskie i Socialʹnye Peremeny анализ социальных сетей онлайн-сообщества ВКонтакте топология сетей большие данные анализ данных в R сетевая гомофилия пропущенные данные |
author_facet |
Adelia D. KAVEEVA Konstantin E. GURIN |
author_sort |
Adelia D. KAVEEVA |
title |
Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей |
title_short |
Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей |
title_full |
Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей |
title_fullStr |
Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей |
title_full_unstemmed |
Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей |
title_sort |
локальные сети дружбы "вконтакте": восстановление пропущенных данных o городе проживания пользователей |
publisher |
Russian Public Opinion Research Center (VCIOM) |
series |
Monitoring Obŝestvennogo Mneniâ: Ekonomičeskie i Socialʹnye Peremeny |
issn |
2219-5467 |
publishDate |
2018-07-01 |
description |
Социальные онлайн-сети, в частности, самая популярная российская сеть "ВКонтакте", являются источником большого количества доступной информации о пользователях благодаря политике открытости данных. Это дает исследователям возможность изучения топологии сетей взаимодействий, возникающих в онлайн-среде, с применением сетевого подхода (social network analysis). Однако личные данные, которые пользователи сообщают о себе в публичных профилях, зачастую неполны: люди могут по невниманию или умышленно пропускать заполнение тех полей в профиле, которые отражают их пол, возраст, город проживания и другие персональные данные. Эти характеристики играют большую роль при построении социальных сетей в качестве атрибутов "узлов" (то есть пользователей), что позволяет выделять кластеры схожих между собой агентов и их паттерны поведения. Отсутствие некоторых данных может существенно влиять на сетевые метрики (например, размер сети, среднюю длину пути между двумя участниками, распределение числа связей между ними и другие) и искажать полученные результаты. В связи с этим возникает потребность в восполнении пропущенной части данных. В статье представлен опыт создания и применения классификатора, который позволяет определить, является ли пользователь сети "ВКонтакте", не указавший в профиле место жительства, жителем конкретного города. Классификатор был создан и апробирован на примере сети пользователей из г. Ижевска. Он основан на методе дерева решений, которое поэтапно фильтрует аккаунты через ряд вопросов, а затем принимает решение, считать ли данный аккаунт профилем ижевчанина или нет. В статье объяснен выбор основных показателей, которые помогают классификатору определить город пользователя; описан алгоритм работы классификатора и показано, как изменяется топология сети, когда в нее добавляются пропущенные данные о городе проживания пользователей. |
topic |
анализ социальных сетей онлайн-сообщества ВКонтакте топология сетей большие данные анализ данных в R сетевая гомофилия пропущенные данные |
url |
https://monitoringjournal.ru/index.php/monitoring/article/view/208 |
work_keys_str_mv |
AT adeliadkaveeva lokalʹnyesetidružbyvkontaktevosstanovleniepropuŝennyhdannyhogorodeproživaniâpolʹzovatelej AT konstantinegurin lokalʹnyesetidružbyvkontaktevosstanovleniepropuŝennyhdannyhogorodeproživaniâpolʹzovatelej |
_version_ |
1725345738131505152 |