Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux

Dans ce manuscrit, nous étudions la diffusion d'information dans les réseaux sociaux en ligne. Des sites comme Facebook ou Twitter sont en effet devenus aujourd'hui des media d'information à part entière, sur lesquels les utilisateurs échangent de grandes quantités de données. La pl...

Full description

Bibliographic Details
Main Author: Bourigault, Simon
Other Authors: Paris 6
Language:fr
Published: 2016
Subjects:
004
Online Access:http://www.theses.fr/2016PA066368/document
id ndltd-theses.fr-2016PA066368
record_format oai_dc
spelling ndltd-theses.fr-2016PA0663682019-12-22T04:46:06Z Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux Representation learning for information diffusion prediction in social network Apprentissage automatique Apprentissage de représentations Réseaux sociaux Diffusion d'information Intelligence artificielle Détection de source Representation learning Social network Source detection 004 Dans ce manuscrit, nous étudions la diffusion d'information dans les réseaux sociaux en ligne. Des sites comme Facebook ou Twitter sont en effet devenus aujourd'hui des media d'information à part entière, sur lesquels les utilisateurs échangent de grandes quantités de données. La plupart des modèles existant pour expliquer ce phénomène de diffusion sont des modèles génératifs, basés sur des hypothèses fortes concernant la structure et la dynamique temporelle de la diffusion d'information. Nous considérerons dans ce manuscrit le problème de la prédiction de diffusion dans le cas où le graphe social est inconnu, et où seules les actions des utilisateurs peuvent être observées. - Nous proposons, dans un premier temps, une méthode d'apprentissage du modèle independent cascade consistant à ne pas prendre en compte la dimension temporelle de la diffusion. Des résultats expérimentaux obtenus sur des données réelles montrent que cette approche permet d'obtenir un modèle plus performant et plus robuste. - Nous proposons ensuite plusieurs méthodes de prédiction de diffusion reposant sur des technique d'apprentissage de représentations. Celles-ci nous permettent de définir des modèles plus compacts, et plus robustes à la parcimonie des données. - Enfin, nous terminons en appliquant une approche similaire au problème de détection de source, consistant à retrouver l'utilisateur ayant lancé une rumeur sur un réseau social. En utilisant des méthodes d'apprentissage de représentations, nous obtenons pour cette tâche un modèle beaucoup plus rapide et performant que ceux de l'état de l'art. In this thesis, we study information diffusion in online social networks. Websites like Facebook or Twitter have indeed become information medias, on which users create and share a lot of data. Most existing models of the information diffusion phenomenon relies on strong hypothesis about the structure and dynamics of diffusion. In this document, we study the problem of diffusion prediction in the context where the social graph is unknown and only user actions are observed. - We propose a learning algorithm for the independant cascades model that does not take time into account. Experimental results show that this approach obtains better results than time-based learning schemes. - We then propose several representations learning methods for this task of diffusion prediction. This let us define more compact and faster models. - Finally, we apply our representation learning approach to the source detection task, where it obtains much better results than graph-based approaches. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2016PA066368/document Bourigault, Simon 2016-11-10 Paris 6 Gallinari, Patrick Lamprier, Sylvain
collection NDLTD
language fr
sources NDLTD
topic Apprentissage automatique
Apprentissage de représentations
Réseaux sociaux
Diffusion d'information
Intelligence artificielle
Détection de source
Representation learning
Social network
Source detection
004
spellingShingle Apprentissage automatique
Apprentissage de représentations
Réseaux sociaux
Diffusion d'information
Intelligence artificielle
Détection de source
Representation learning
Social network
Source detection
004
Bourigault, Simon
Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
description Dans ce manuscrit, nous étudions la diffusion d'information dans les réseaux sociaux en ligne. Des sites comme Facebook ou Twitter sont en effet devenus aujourd'hui des media d'information à part entière, sur lesquels les utilisateurs échangent de grandes quantités de données. La plupart des modèles existant pour expliquer ce phénomène de diffusion sont des modèles génératifs, basés sur des hypothèses fortes concernant la structure et la dynamique temporelle de la diffusion d'information. Nous considérerons dans ce manuscrit le problème de la prédiction de diffusion dans le cas où le graphe social est inconnu, et où seules les actions des utilisateurs peuvent être observées. - Nous proposons, dans un premier temps, une méthode d'apprentissage du modèle independent cascade consistant à ne pas prendre en compte la dimension temporelle de la diffusion. Des résultats expérimentaux obtenus sur des données réelles montrent que cette approche permet d'obtenir un modèle plus performant et plus robuste. - Nous proposons ensuite plusieurs méthodes de prédiction de diffusion reposant sur des technique d'apprentissage de représentations. Celles-ci nous permettent de définir des modèles plus compacts, et plus robustes à la parcimonie des données. - Enfin, nous terminons en appliquant une approche similaire au problème de détection de source, consistant à retrouver l'utilisateur ayant lancé une rumeur sur un réseau social. En utilisant des méthodes d'apprentissage de représentations, nous obtenons pour cette tâche un modèle beaucoup plus rapide et performant que ceux de l'état de l'art. === In this thesis, we study information diffusion in online social networks. Websites like Facebook or Twitter have indeed become information medias, on which users create and share a lot of data. Most existing models of the information diffusion phenomenon relies on strong hypothesis about the structure and dynamics of diffusion. In this document, we study the problem of diffusion prediction in the context where the social graph is unknown and only user actions are observed. - We propose a learning algorithm for the independant cascades model that does not take time into account. Experimental results show that this approach obtains better results than time-based learning schemes. - We then propose several representations learning methods for this task of diffusion prediction. This let us define more compact and faster models. - Finally, we apply our representation learning approach to the source detection task, where it obtains much better results than graph-based approaches.
author2 Paris 6
author_facet Paris 6
Bourigault, Simon
author Bourigault, Simon
author_sort Bourigault, Simon
title Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
title_short Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
title_full Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
title_fullStr Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
title_full_unstemmed Apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
title_sort apprentissage de représentations pour la prédiction de propagation d'information dans les réseaux sociaux
publishDate 2016
url http://www.theses.fr/2016PA066368/document
work_keys_str_mv AT bourigaultsimon apprentissagederepresentationspourlapredictiondepropagationdinformationdanslesreseauxsociaux
AT bourigaultsimon representationlearningforinformationdiffusionpredictioninsocialnetwork
_version_ 1719305852169486336