Méthodes probabilistes pour l'analyse exploratoire de données textuelles
Nous abordons le problème de la classification non supervisée de documents par des méthodes probabilistes. Notre étude se concentre sur le modèle de mélange de lois multinomiales avec variables latentes thématiques au niveau des documents. La construction de groupes de documents thématiquement homog...
Main Author: | |
---|---|
Published: |
Télécom ParisTech
2006
|
Subjects: | |
Online Access: | http://pastel.archives-ouvertes.fr/pastel-00002424 http://pastel.archives-ouvertes.fr/docs/00/50/04/95/PDF/these_rigouste.pdf |