Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe

Un des objectifs de lanalyse de données symboliques est de permettre une meilleure modélisation des variations et des imprécisions des données réelles. Ces données expriment en effet, un niveau de connaissance plus élevé, la modélisation doit donc offrir un formalisme plus riche que dans le cadre de...

Full description

Bibliographic Details
Main Author: El Golli, Aïcha
Language:FRE
Published: Université Paris Dauphine - Paris IX 2004
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00178900
http://tel.archives-ouvertes.fr/docs/00/17/89/00/PDF/TU-1117.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00178900
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-001789002013-01-07T18:42:46Z http://tel.archives-ouvertes.fr/tel-00178900 http://tel.archives-ouvertes.fr/docs/00/17/89/00/PDF/TU-1117.pdf Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe El Golli, Aïcha [INFO:INFO_HC] Computer Science/Human-Computer Interaction ANALYSE DE DONNÉES ANALYSE DE DONNÉES SYMBOLIQUES : BASE DE DONNÉES RELATIONNELLE GÉNÉRALISATION CLASSIFICATION NON SUPERVISÉE ALGORITHME DIVISIF CARTES TOPOLOGIQUES DE KOHONEN DISSIMILARITÉ Un des objectifs de lanalyse de données symboliques est de permettre une meilleure modélisation des variations et des imprécisions des données réelles. Ces données expriment en effet, un niveau de connaissance plus élevé, la modélisation doit donc offrir un formalisme plus riche que dans le cadre de lanalyse de données classiques. Un ensemble dopérateurs de généralisation symbolique existent et permettent une synthèse et représentation des données par le formalisme des assertions, formalisme défini en analyse de données symboliques. Cette généralisation étant supervisée, est souvent sensible aux observations aberrantes. Lorsque les données que lon souhaite généraliser sont hétérogènes, certaines assertions incluent des observations virtuelles. Face à ce nouveau formalisme et donc cette extension dordre sémantique que lanalyse de données symbolique a apporté, une nouvelle approche de traitement et dinterprétation simpose. Notre objectif au cours de ce travail est daméliorer tout dabord cette généralisation et de proposer ensuite une méthode de traitement de ces données. Les contributions originales de cette thèse portent sur de nouvelles approches de représentation et de classification des données à structure complexe. Nous proposons donc une décomposition permettant daméliorer la généralisation tout en offrant le formalisme symbolique. Cette décomposition est basée sur un algorithme divisif de classification. Nous avons aussi proposé une méthode de généralisation symbolique non supervisée basée sur l'algorithme des cartes topologiques de Kohonen. L'avantage de cette méthode est de réduire les données d'une manière non supervisée et de modéliser les groupes homogènes obtenus par des données symboliques. Notre seconde contribution porte sur lélaboration dune méthode de classification traitant les données à structure complexe. Cette méthode est une adaptation de la version batch de lalgorithme des cartes topologiques de Kohonen aux tableaux de dissimilarités. En effet, seule la définition dune mesure de dissimilarité adéquate, est nécessaire pour le bon déroulement de la méthode. 2004-06-01 FRE PhD thesis Université Paris Dauphine - Paris IX
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_HC] Computer Science/Human-Computer Interaction
ANALYSE DE DONNÉES
ANALYSE DE DONNÉES SYMBOLIQUES : BASE DE DONNÉES RELATIONNELLE
GÉNÉRALISATION
CLASSIFICATION NON SUPERVISÉE
ALGORITHME DIVISIF
CARTES TOPOLOGIQUES DE KOHONEN
DISSIMILARITÉ
spellingShingle [INFO:INFO_HC] Computer Science/Human-Computer Interaction
ANALYSE DE DONNÉES
ANALYSE DE DONNÉES SYMBOLIQUES : BASE DE DONNÉES RELATIONNELLE
GÉNÉRALISATION
CLASSIFICATION NON SUPERVISÉE
ALGORITHME DIVISIF
CARTES TOPOLOGIQUES DE KOHONEN
DISSIMILARITÉ
El Golli, Aïcha
Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
description Un des objectifs de lanalyse de données symboliques est de permettre une meilleure modélisation des variations et des imprécisions des données réelles. Ces données expriment en effet, un niveau de connaissance plus élevé, la modélisation doit donc offrir un formalisme plus riche que dans le cadre de lanalyse de données classiques. Un ensemble dopérateurs de généralisation symbolique existent et permettent une synthèse et représentation des données par le formalisme des assertions, formalisme défini en analyse de données symboliques. Cette généralisation étant supervisée, est souvent sensible aux observations aberrantes. Lorsque les données que lon souhaite généraliser sont hétérogènes, certaines assertions incluent des observations virtuelles. Face à ce nouveau formalisme et donc cette extension dordre sémantique que lanalyse de données symbolique a apporté, une nouvelle approche de traitement et dinterprétation simpose. Notre objectif au cours de ce travail est daméliorer tout dabord cette généralisation et de proposer ensuite une méthode de traitement de ces données. Les contributions originales de cette thèse portent sur de nouvelles approches de représentation et de classification des données à structure complexe. Nous proposons donc une décomposition permettant daméliorer la généralisation tout en offrant le formalisme symbolique. Cette décomposition est basée sur un algorithme divisif de classification. Nous avons aussi proposé une méthode de généralisation symbolique non supervisée basée sur l'algorithme des cartes topologiques de Kohonen. L'avantage de cette méthode est de réduire les données d'une manière non supervisée et de modéliser les groupes homogènes obtenus par des données symboliques. Notre seconde contribution porte sur lélaboration dune méthode de classification traitant les données à structure complexe. Cette méthode est une adaptation de la version batch de lalgorithme des cartes topologiques de Kohonen aux tableaux de dissimilarités. En effet, seule la définition dune mesure de dissimilarité adéquate, est nécessaire pour le bon déroulement de la méthode.
author El Golli, Aïcha
author_facet El Golli, Aïcha
author_sort El Golli, Aïcha
title Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
title_short Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
title_full Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
title_fullStr Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
title_full_unstemmed Extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
title_sort extraction de données symboliques et cartes topologiques: application aux données ayant une structure complexe
publisher Université Paris Dauphine - Paris IX
publishDate 2004
url http://tel.archives-ouvertes.fr/tel-00178900
http://tel.archives-ouvertes.fr/docs/00/17/89/00/PDF/TU-1117.pdf
work_keys_str_mv AT elgolliaicha extractiondedonneessymboliquesetcartestopologiquesapplicationauxdonneesayantunestructurecomplexe
_version_ 1716453886299996160