Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues

Cette thèse propose une méthode pour alimenter une ontologie, une structure de concepts liés par des relations sémantiques, par des termes français, anglais et allemands à partir de corpus spécialisés comparables. Son apport principal est le développement des méthodes d'extraction utilisant des...

Full description

Bibliographic Details
Main Author: Korenchuk, Yuliya
Other Authors: Strasbourg
Language:fr
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017STRAC014/document
id ndltd-theses.fr-2017STRAC014
record_format oai_dc
spelling ndltd-theses.fr-2017STRAC0142018-05-19T04:23:12Z Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues Method of ontology enrichment and population from multilingual comparable domain specific corpus Ontologies Extraction terminologique Alignement bilingue de termes Corpus comparables Ressources endogènes Ontologies Terminology extraction Bilingual alignment of terms Comparable corpora Endogenous resources 005.13 Cette thèse propose une méthode pour alimenter une ontologie, une structure de concepts liés par des relations sémantiques, par des termes français, anglais et allemands à partir de corpus spécialisés comparables. Son apport principal est le développement des méthodes d'extraction utilisant des ressources endogènes apprises à partir de corpus et d'ontologie. Exploitant des n-grammes de caractères, elles sont disponibles et indépendantes vis-à-vis de la langue et du domaine. La première contribution porte sur l'utilisation des ressources morphologiques et morphosyntaxiques endogènes pour extraire des termes mono- et polylexicaux à partir de corpus. La deuxième contribution vise à exploiter des ressources endogènes pour identifier leurs traductions. La troisième contribution concerne la construction des familles morphologiques endogènes servant à alimenter l'ontologie. This thesis proposes a method of enrichment and population of an ontology, a structure of concepts linked by semantic relations, by terms in French, English and German from comparable domain-specific corpora. Our main contribution is the development of extraction methods based on endogenous resources, learned from the corpus and the ontology being analyzed. Using caracter n-grams, these resources are available and independent of a particular language or domain. The first contribution concerns the use of endogenous morphological and morphosyntactic resources for mono- and polylexical terms extraction from the corpus. The second contribution aims to use endogenous resources to identify translations for these terms. The third contribution concerns the construction of endogenous morphological families designed to enrich and populate the ontology. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2017STRAC014/document Korenchuk, Yuliya 2017-07-11 Strasbourg Todiraşcu-Courtier, Amalia Bernhard, Delphine
collection NDLTD
language fr
sources NDLTD
topic Ontologies
Extraction terminologique
Alignement bilingue de termes
Corpus comparables
Ressources endogènes
Ontologies
Terminology extraction
Bilingual alignment of terms
Comparable corpora
Endogenous resources
005.13
spellingShingle Ontologies
Extraction terminologique
Alignement bilingue de termes
Corpus comparables
Ressources endogènes
Ontologies
Terminology extraction
Bilingual alignment of terms
Comparable corpora
Endogenous resources
005.13
Korenchuk, Yuliya
Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
description Cette thèse propose une méthode pour alimenter une ontologie, une structure de concepts liés par des relations sémantiques, par des termes français, anglais et allemands à partir de corpus spécialisés comparables. Son apport principal est le développement des méthodes d'extraction utilisant des ressources endogènes apprises à partir de corpus et d'ontologie. Exploitant des n-grammes de caractères, elles sont disponibles et indépendantes vis-à-vis de la langue et du domaine. La première contribution porte sur l'utilisation des ressources morphologiques et morphosyntaxiques endogènes pour extraire des termes mono- et polylexicaux à partir de corpus. La deuxième contribution vise à exploiter des ressources endogènes pour identifier leurs traductions. La troisième contribution concerne la construction des familles morphologiques endogènes servant à alimenter l'ontologie. === This thesis proposes a method of enrichment and population of an ontology, a structure of concepts linked by semantic relations, by terms in French, English and German from comparable domain-specific corpora. Our main contribution is the development of extraction methods based on endogenous resources, learned from the corpus and the ontology being analyzed. Using caracter n-grams, these resources are available and independent of a particular language or domain. The first contribution concerns the use of endogenous morphological and morphosyntactic resources for mono- and polylexical terms extraction from the corpus. The second contribution aims to use endogenous resources to identify translations for these terms. The third contribution concerns the construction of endogenous morphological families designed to enrich and populate the ontology.
author2 Strasbourg
author_facet Strasbourg
Korenchuk, Yuliya
author Korenchuk, Yuliya
author_sort Korenchuk, Yuliya
title Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
title_short Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
title_full Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
title_fullStr Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
title_full_unstemmed Méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
title_sort méthode d'enrichissement et d'élargissement d'une ontologie à partir de corpus de spécialité multilingues
publishDate 2017
url http://www.theses.fr/2017STRAC014/document
work_keys_str_mv AT korenchukyuliya methodedenrichissementetdelargissementduneontologieapartirdecorpusdespecialitemultilingues
AT korenchukyuliya methodofontologyenrichmentandpopulationfrommultilingualcomparabledomainspecificcorpus
_version_ 1718641180586016768