Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей

Социальные онлайн-сети, в частности, самая популярная российская сеть "ВКонтакте", являются источником большого количества доступной информации о пользователях благодаря политике открытости данных. Это дает исследователям возможность изучения топологии сетей взаимодействий, возникающих в о...

Full description

Bibliographic Details
Published in:Мониторинг общественного мнения: экономические и социальные перемены
Main Authors: Adelia D. KAVEEVA, Konstantin E. GURIN
Format: Article
Language:English
Published: Russian Public Opinion Research Center (VCIOM) 2018-07-01
Subjects:
Online Access:https://monitoringjournal.ru/index.php/monitoring/article/view/208
_version_ 1848652444737732608
author Adelia D. KAVEEVA
Konstantin E. GURIN
author_facet Adelia D. KAVEEVA
Konstantin E. GURIN
author_sort Adelia D. KAVEEVA
collection DOAJ
container_title Мониторинг общественного мнения: экономические и социальные перемены
description Социальные онлайн-сети, в частности, самая популярная российская сеть "ВКонтакте", являются источником большого количества доступной информации о пользователях благодаря политике открытости данных. Это дает исследователям возможность изучения топологии сетей взаимодействий, возникающих в онлайн-среде, с применением сетевого подхода (social network analysis). Однако личные данные, которые пользователи сообщают о себе в публичных профилях, зачастую неполны: люди могут по невниманию или умышленно пропускать заполнение тех полей в профиле, которые отражают их пол, возраст, город проживания и другие персональные данные. Эти характеристики играют большую роль при построении социальных сетей в качестве атрибутов "узлов" (то есть пользователей), что позволяет выделять кластеры схожих между собой агентов и их паттерны поведения. Отсутствие некоторых данных может существенно влиять на сетевые метрики (например, размер сети, среднюю длину пути между двумя участниками, распределение числа связей между ними и другие) и искажать полученные результаты. В связи с этим возникает потребность в восполнении пропущенной части данных. В статье представлен опыт создания и применения классификатора, который позволяет определить, является ли пользователь сети "ВКонтакте", не указавший в профиле место жительства, жителем конкретного города. Классификатор был создан и апробирован на примере сети пользователей из г. Ижевска. Он основан на методе дерева решений, которое поэтапно фильтрует аккаунты через ряд вопросов, а затем принимает решение, считать ли данный аккаунт профилем ижевчанина или нет. В статье объяснен выбор основных показателей, которые помогают классификатору определить город пользователя; описан алгоритм работы классификатора и показано, как изменяется топология сети, когда в нее добавляются пропущенные данные о городе проживания пользователей.
format Article
id doaj-d2ef753b70354dcfacbae1fd4a2b4712
institution Directory of Open Access Journals
issn 2219-5467
language English
publishDate 2018-07-01
publisher Russian Public Opinion Research Center (VCIOM)
record_format Article
spelling doaj-d2ef753b70354dcfacbae1fd4a2b47122025-11-02T22:39:25ZengRussian Public Opinion Research Center (VCIOM)Мониторинг общественного мнения: экономические и социальные перемены2219-54672018-07-013787810.14515/monitoring.2018.3.05208Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователейAdelia D. KAVEEVA0Konstantin E. GURIN1Казанский федеральный университетКорпорация «Центр»Социальные онлайн-сети, в частности, самая популярная российская сеть "ВКонтакте", являются источником большого количества доступной информации о пользователях благодаря политике открытости данных. Это дает исследователям возможность изучения топологии сетей взаимодействий, возникающих в онлайн-среде, с применением сетевого подхода (social network analysis). Однако личные данные, которые пользователи сообщают о себе в публичных профилях, зачастую неполны: люди могут по невниманию или умышленно пропускать заполнение тех полей в профиле, которые отражают их пол, возраст, город проживания и другие персональные данные. Эти характеристики играют большую роль при построении социальных сетей в качестве атрибутов "узлов" (то есть пользователей), что позволяет выделять кластеры схожих между собой агентов и их паттерны поведения. Отсутствие некоторых данных может существенно влиять на сетевые метрики (например, размер сети, среднюю длину пути между двумя участниками, распределение числа связей между ними и другие) и искажать полученные результаты. В связи с этим возникает потребность в восполнении пропущенной части данных. В статье представлен опыт создания и применения классификатора, который позволяет определить, является ли пользователь сети "ВКонтакте", не указавший в профиле место жительства, жителем конкретного города. Классификатор был создан и апробирован на примере сети пользователей из г. Ижевска. Он основан на методе дерева решений, которое поэтапно фильтрует аккаунты через ряд вопросов, а затем принимает решение, считать ли данный аккаунт профилем ижевчанина или нет. В статье объяснен выбор основных показателей, которые помогают классификатору определить город пользователя; описан алгоритм работы классификатора и показано, как изменяется топология сети, когда в нее добавляются пропущенные данные о городе проживания пользователей.https://monitoringjournal.ru/index.php/monitoring/article/view/208анализ социальных сетейонлайн-сообществаВКонтактетопология сетейбольшие данныеанализ данных в Rсетевая гомофилияпропущенные данные
spellingShingle Adelia D. KAVEEVA
Konstantin E. GURIN
Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
анализ социальных сетей
онлайн-сообщества
ВКонтакте
топология сетей
большие данные
анализ данных в R
сетевая гомофилия
пропущенные данные
title Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
title_full Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
title_fullStr Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
title_full_unstemmed Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
title_short Локальные сети дружбы "ВКонтакте": восстановление пропущенных данных o городе проживания пользователей
title_sort локальные сети дружбы вконтакте восстановление пропущенных данных o городе проживания пользователей
topic анализ социальных сетей
онлайн-сообщества
ВКонтакте
топология сетей
большие данные
анализ данных в R
сетевая гомофилия
пропущенные данные
url https://monitoringjournal.ru/index.php/monitoring/article/view/208
work_keys_str_mv AT adeliadkaveeva lokalʹnyesetidružbyvkontaktevosstanovleniepropuŝennyhdannyhogorodeproživaniâpolʹzovatelej
AT konstantinegurin lokalʹnyesetidružbyvkontaktevosstanovleniepropuŝennyhdannyhogorodeproživaniâpolʹzovatelej