Knowledge Base Population based on Entity Graph Analysis

Le peuplement de base de connaissance (KBP) est une tâche importante qui présente de nombreux défis pour le traitement automatique des langues. L'objectif de cette tâche est d'extraire des connaissances de textes et de les structurer afin de compléter une base de connaissances. Nous nous s...

Full description

Bibliographic Details
Main Author: Rahman, Md Rashedur
Other Authors: Université Paris-Saclay (ComUE)
Language:en
Published: 2018
Subjects:
Online Access:http://www.theses.fr/2018SACLS092/document
id ndltd-theses.fr-2018SACLS092
record_format oai_dc
spelling ndltd-theses.fr-2018SACLS0922020-02-04T03:23:31Z Knowledge Base Population based on Entity Graph Analysis Peuplement d'une base de connaissance fondé sur l'exploitation d'un graphe d'entités Traitement des langues naturelles Extraction de relation Validation de relation Graphe de communauté Peuplement de base de connaissance Natural Language Processing Relation extraction Relation validation Community graph Knowledge base population Le peuplement de base de connaissance (KBP) est une tâche importante qui présente de nombreux défis pour le traitement automatique des langues. L'objectif de cette tâche est d'extraire des connaissances de textes et de les structurer afin de compléter une base de connaissances. Nous nous sommes intéressés à la reconnaissance de relations entre entités. L'extraction de relations (RE) entre une paire de mentions d'entités est une tâche difficile en particulier pour les relations en domaine ouvert. Généralement, ces relations sont extraites en fonction des informations lexicales et syntaxiques au niveau de la phrase. Cependant, l'exploitation d'informations globales sur les entités n'a pas encore été explorée. Nous proposons d'extraire un graphe d'entités du corpus global et de calculer des caractéristiques sur ce graphe afin de capturer des indices des relations entre paires d'entités. Pour évaluer la pertinence des fonctionnalités proposées, nous les avons testées sur une tâche de validation de relation dont le but est de décider l'exactitude de relations extraites par différents systèmes. Les résultats expérimentaux montrent que les caractéristiques proposées conduisent à améliorer les résultats de l'état de l'art. Knowledge Base Population (KBP) is an important and challenging task specially when it has to be done automatically. The objective of KBP task is to make a collection of facts of the world. A Knowledge Base (KB) contains different entities, relationships among them and various properties of the entities. Relation extraction (RE) between a pair of entity mentions from text plays a vital role in KBP task. RE is also a challenging task specially for open domain relations. Generally, relations are extracted based on the lexical and syntactical information at the sentence level. However, global information about known entities has not been explored yet for RE task. We propose to extract a graph of entities from the overall corpus and to compute features on this graph that are able to capture some evidence of holding relationships between a pair of entities. In order to evaluate the relevance of the proposed features, we tested them on a task of relation validation which examines the correctness of relations that are extracted by different RE systems. Experimental results show that the proposed features lead to outperforming the state-of-the-art system. Electronic Thesis or Dissertation Text en http://www.theses.fr/2018SACLS092/document Rahman, Md Rashedur 2018-04-17 Université Paris-Saclay (ComUE) Grau, Brigitte
collection NDLTD
language en
sources NDLTD
topic Traitement des langues naturelles
Extraction de relation
Validation de relation
Graphe de communauté
Peuplement de base de connaissance
Natural Language Processing
Relation extraction
Relation validation
Community graph
Knowledge base population

spellingShingle Traitement des langues naturelles
Extraction de relation
Validation de relation
Graphe de communauté
Peuplement de base de connaissance
Natural Language Processing
Relation extraction
Relation validation
Community graph
Knowledge base population

Rahman, Md Rashedur
Knowledge Base Population based on Entity Graph Analysis
description Le peuplement de base de connaissance (KBP) est une tâche importante qui présente de nombreux défis pour le traitement automatique des langues. L'objectif de cette tâche est d'extraire des connaissances de textes et de les structurer afin de compléter une base de connaissances. Nous nous sommes intéressés à la reconnaissance de relations entre entités. L'extraction de relations (RE) entre une paire de mentions d'entités est une tâche difficile en particulier pour les relations en domaine ouvert. Généralement, ces relations sont extraites en fonction des informations lexicales et syntaxiques au niveau de la phrase. Cependant, l'exploitation d'informations globales sur les entités n'a pas encore été explorée. Nous proposons d'extraire un graphe d'entités du corpus global et de calculer des caractéristiques sur ce graphe afin de capturer des indices des relations entre paires d'entités. Pour évaluer la pertinence des fonctionnalités proposées, nous les avons testées sur une tâche de validation de relation dont le but est de décider l'exactitude de relations extraites par différents systèmes. Les résultats expérimentaux montrent que les caractéristiques proposées conduisent à améliorer les résultats de l'état de l'art. === Knowledge Base Population (KBP) is an important and challenging task specially when it has to be done automatically. The objective of KBP task is to make a collection of facts of the world. A Knowledge Base (KB) contains different entities, relationships among them and various properties of the entities. Relation extraction (RE) between a pair of entity mentions from text plays a vital role in KBP task. RE is also a challenging task specially for open domain relations. Generally, relations are extracted based on the lexical and syntactical information at the sentence level. However, global information about known entities has not been explored yet for RE task. We propose to extract a graph of entities from the overall corpus and to compute features on this graph that are able to capture some evidence of holding relationships between a pair of entities. In order to evaluate the relevance of the proposed features, we tested them on a task of relation validation which examines the correctness of relations that are extracted by different RE systems. Experimental results show that the proposed features lead to outperforming the state-of-the-art system.
author2 Université Paris-Saclay (ComUE)
author_facet Université Paris-Saclay (ComUE)
Rahman, Md Rashedur
author Rahman, Md Rashedur
author_sort Rahman, Md Rashedur
title Knowledge Base Population based on Entity Graph Analysis
title_short Knowledge Base Population based on Entity Graph Analysis
title_full Knowledge Base Population based on Entity Graph Analysis
title_fullStr Knowledge Base Population based on Entity Graph Analysis
title_full_unstemmed Knowledge Base Population based on Entity Graph Analysis
title_sort knowledge base population based on entity graph analysis
publishDate 2018
url http://www.theses.fr/2018SACLS092/document
work_keys_str_mv AT rahmanmdrashedur knowledgebasepopulationbasedonentitygraphanalysis
AT rahmanmdrashedur peuplementdunebasedeconnaissancefondesurlexploitationdungraphedentites
_version_ 1719312627264389120