Traitement de données numériques par analyse formelle de concepts et structures de patrons

Le sujet principal de cette thèse porte sur la fouille de données numériques et plus particulièrement de données d'expression de gènes. Ces données caractérisent le comportement de gènes dans diverses situations biologiques (temps, cellule, etc.). Un problème important consiste à établir des gr...

Full description

Bibliographic Details
Main Author: Kaytoue, Mehdi
Other Authors: Nancy 1
Language:en
Published: 2011
Subjects:
Online Access:http://www.theses.fr/2011NAN10015/document
id ndltd-theses.fr-2011NAN10015
record_format oai_dc
spelling ndltd-theses.fr-2011NAN100152019-05-24T03:32:06Z Traitement de données numériques par analyse formelle de concepts et structures de patrons Mining numerical data with formal concept analysis and pattern structures Découverte de connaissances Analyse formelle de concepts Extraction de motifs numériques Bi-clustering Fusion d'information Knowledge discovery in databases Formal concept analysis Numerical pattern mining Biclustering Information fusion Le sujet principal de cette thèse porte sur la fouille de données numériques et plus particulièrement de données d'expression de gènes. Ces données caractérisent le comportement de gènes dans diverses situations biologiques (temps, cellule, etc.). Un problème important consiste à établir des groupes de gènes partageant un même comportement biologique. Cela permet d'identifier les gènes actifs lors d'un processus biologique, comme par exemple les gènes actifs lors de la défense d'un organisme face à une attaque. Le cadre de la thèse s'inscrit donc dans celui de l'extraction de connaissances à partir de données biologiques. Nous nous proposons d'étudier comment la méthode de classification conceptuelle qu'est l'analyse formelle de concepts (AFC) peut répondre au problème d'extraction de familles de gènes. Pour cela, nous avons développé et expérimenté diverses méthodes originales en nous appuyant sur une extension peu explorée de l'AFC : les structures de patrons. Plus précisément, nous montrons comment construire un treillis de concepts synthétisant des familles de gènes à comportement similaire. L'originalité de ce travail est (i) de construire un treillis de concepts sans discrétisation préalable des données de manière efficace, (ii) d'introduire une relation de similarité entres les gènes et (iii) de proposer des ensembles minimaux de conditions nécessaires et suffisantes expliquant les regroupements formés. Les résultats de ces travaux nous amènent également à montrer comment les structures de patrons peuvent améliorer la prise de décision quant à la dangerosité de pratiques agricoles dans le vaste domaine de la fusion d'information The main topic of this thesis addresses the important problem of mining numerical data, and especially gene expression data. These data characterize the behaviour of thousand of genes in various biological situations (time, cell, etc.).A difficult task consists in clustering genes to obtain classes of genes with similar behaviour, supposed to be involved together within a biological process.Accordingly, we are interested in designing and comparing methods in the field of knowledge discovery from biological data. We propose to study how the conceptual classification method called Formal Concept Analysis (FCA) can handle the problem of extracting interesting classes of genes. For this purpose, we have designed and experimented several original methods based on an extension of FCA called pattern structures. Furthermore, we show that these methods can enhance decision making in agronomy and crop sanity in the vast formal domain of information fusion Electronic Thesis or Dissertation Text en http://www.theses.fr/2011NAN10015/document Kaytoue, Mehdi 2011-04-22 Nancy 1 Napoli, Amedeo
collection NDLTD
language en
sources NDLTD
topic Découverte de connaissances
Analyse formelle de concepts
Extraction de motifs numériques
Bi-clustering
Fusion d'information
Knowledge discovery in databases
Formal concept analysis
Numerical pattern mining
Biclustering
Information fusion
spellingShingle Découverte de connaissances
Analyse formelle de concepts
Extraction de motifs numériques
Bi-clustering
Fusion d'information
Knowledge discovery in databases
Formal concept analysis
Numerical pattern mining
Biclustering
Information fusion
Kaytoue, Mehdi
Traitement de données numériques par analyse formelle de concepts et structures de patrons
description Le sujet principal de cette thèse porte sur la fouille de données numériques et plus particulièrement de données d'expression de gènes. Ces données caractérisent le comportement de gènes dans diverses situations biologiques (temps, cellule, etc.). Un problème important consiste à établir des groupes de gènes partageant un même comportement biologique. Cela permet d'identifier les gènes actifs lors d'un processus biologique, comme par exemple les gènes actifs lors de la défense d'un organisme face à une attaque. Le cadre de la thèse s'inscrit donc dans celui de l'extraction de connaissances à partir de données biologiques. Nous nous proposons d'étudier comment la méthode de classification conceptuelle qu'est l'analyse formelle de concepts (AFC) peut répondre au problème d'extraction de familles de gènes. Pour cela, nous avons développé et expérimenté diverses méthodes originales en nous appuyant sur une extension peu explorée de l'AFC : les structures de patrons. Plus précisément, nous montrons comment construire un treillis de concepts synthétisant des familles de gènes à comportement similaire. L'originalité de ce travail est (i) de construire un treillis de concepts sans discrétisation préalable des données de manière efficace, (ii) d'introduire une relation de similarité entres les gènes et (iii) de proposer des ensembles minimaux de conditions nécessaires et suffisantes expliquant les regroupements formés. Les résultats de ces travaux nous amènent également à montrer comment les structures de patrons peuvent améliorer la prise de décision quant à la dangerosité de pratiques agricoles dans le vaste domaine de la fusion d'information === The main topic of this thesis addresses the important problem of mining numerical data, and especially gene expression data. These data characterize the behaviour of thousand of genes in various biological situations (time, cell, etc.).A difficult task consists in clustering genes to obtain classes of genes with similar behaviour, supposed to be involved together within a biological process.Accordingly, we are interested in designing and comparing methods in the field of knowledge discovery from biological data. We propose to study how the conceptual classification method called Formal Concept Analysis (FCA) can handle the problem of extracting interesting classes of genes. For this purpose, we have designed and experimented several original methods based on an extension of FCA called pattern structures. Furthermore, we show that these methods can enhance decision making in agronomy and crop sanity in the vast formal domain of information fusion
author2 Nancy 1
author_facet Nancy 1
Kaytoue, Mehdi
author Kaytoue, Mehdi
author_sort Kaytoue, Mehdi
title Traitement de données numériques par analyse formelle de concepts et structures de patrons
title_short Traitement de données numériques par analyse formelle de concepts et structures de patrons
title_full Traitement de données numériques par analyse formelle de concepts et structures de patrons
title_fullStr Traitement de données numériques par analyse formelle de concepts et structures de patrons
title_full_unstemmed Traitement de données numériques par analyse formelle de concepts et structures de patrons
title_sort traitement de données numériques par analyse formelle de concepts et structures de patrons
publishDate 2011
url http://www.theses.fr/2011NAN10015/document
work_keys_str_mv AT kaytouemehdi traitementdedonneesnumeriquesparanalyseformelledeconceptsetstructuresdepatrons
AT kaytouemehdi miningnumericaldatawithformalconceptanalysisandpatternstructures
_version_ 1719192201870704640