Détection automatique de l'ironie dans les contenus générés par les utilisateurs

Cette thèse a pour objectif la détection du langage figuratif dans les réseaux sociaux. Nous nous focalisons en particulier sur l'ironie et le sarcasme dans Twitter et proposons une approche basée sur l'apprentissage supervisée afin de prédire si le message véhiculé dans un tweet est ironi...

Full description

Bibliographic Details
Main Author: Karoui, Jihen
Other Authors: Toulouse 3
Language:fr
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017TOU30145/document
Description
Summary:Cette thèse a pour objectif la détection du langage figuratif dans les réseaux sociaux. Nous nous focalisons en particulier sur l'ironie et le sarcasme dans Twitter et proposons une approche basée sur l'apprentissage supervisée afin de prédire si le message véhiculé dans un tweet est ironique ou non. Pour ce faire, trois étapes ont été réalisées : (1) Analyse des phénomènes pragmatiques de l'ironie et annotation multi-niveaux d'un corpus de référence, (2) Développement d'un modèle de détection automatique pour les tweets en français qui exploite à la fois des traits sémantiques et le contexte extralinguistique, (3) Etude de la portabilité du modèle pour la détection de l'ironie dans un cadre multilingue (italien, anglais et arabe). Les résultats obtenus pour cette tâche extrêmement complexe sont très encourageants et permettrons d'améliorer sensiblement la détection de polarité lors de l'analyse de sentiments. === This thesis aims to detect figurative language devices in social networks. We focus in particular on irony and sarcasm in Twitter and propose an approach based on supervised learning to predict if a tweet is ironic or not. This required three steps: (1) Analyze the pragmatic phenomena of irony and a multi-level annotation of a corpus of reference, (2) Development of an automatic detection system for French tweets that exploits both semantic features and the extra-linguistic context, (3) Study of the portability of the model to detect irony in a multilingual setting (Italian, English and Arabic). The obtained results for this extremely complex task are very encouraging and will allow a significant improvement of polarity detection in sentiments analysis.