Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures

Les motifs graduels visent à décrire des co-variations au sein des données et sont de la forme plus l'âge est important, plus le salaire est élevé. Ces motifs ont fait l'objet de nombreux travaux en fouille de données ces dernières années, du point de vue des définitions que peuvent avoir...

Full description

Bibliographic Details
Main Author: Quintero Flores, Perfecto Malaquias
Other Authors: Montpellier 2
Language:en
Published: 2013
Subjects:
Online Access:http://www.theses.fr/2013MON20232/document
id ndltd-theses.fr-2013MON20232
record_format oai_dc
spelling ndltd-theses.fr-2013MON202322019-06-13T03:22:44Z Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures Fouille de motifs graduels flous basée sur architectures multi-coeur Fouille de donnees Logique floue Parallelisation Bases de donnees Data mining Fuzzy logic Parallelization Databases Les motifs graduels visent à décrire des co-variations au sein des données et sont de la forme plus l'âge est important, plus le salaire est élevé. Ces motifs ont fait l'objet de nombreux travaux en fouille de données ces dernières années, du point de vue des définitions que peuvent avoir de tels motifs et d'un point de vue algorithmique pour les extraire efficacement. Ces définitions et algorithmes considèrent qu'il est possible d'ordonner de manière stricte les valeurs (par exemple l'âge, le salaire). Or, dans de nombreux champs applicatifs, il est difficile voire impossible d'ordonner de cette manière. Par exemple, quand l'on considère l'expression de gènes, dire que l'expression d'un gène est plus importante que l'expression d'un autre gène quand leurs expressions ne diffèrent qu'à la dixième décimale n'a pas de sens d'un point de vue biologique. Ainsi, nous proposons dans cette thèse une approche fondée sur les ordres flous. Les algorithmes étant très consommateurs tant en mémoire qu'en temps de calcul, nous proposons des optimisations d'une part du stockage des degrés flous et d'autre part de calcul parallélisé. Les expérimentations que nous avons menées sur des bases de données synthétiques et réelles montrent l'intérêt de notre approche. Gradual patterns aim at describing co-variations of data such as the older, the higher the salary. They have been more and more studied from the data mining point of view in recent years, leading to several ways of defining their meaning and and several algorithms to automatically extract them.They consider that data can be ordered regarding the values taken on the attributes (e.g. the age and the salary).However, in many application domains, it is hardly possible to consider that data values are crisply ordered. For instance, when considering gene expression, it is not true, from the biological point of view, to say that Gene 1 is more expressed than Gene 2 if the levels of expression only differ from the tenth decimal. This thesis thus considers fuzzy orderings and propose both formal definitions and algorithms to extract gradual patterns considering fuzzy orderings. As these algorithms are both time and memory consuming, we propose some optimizations based on an efficient storage of the fuzzy ordering informationcoupled with parallel algorithms. Experimental results run on synthetic and real database show the interest or our proposal. Electronic Thesis or Dissertation Text en http://www.theses.fr/2013MON20232/document Quintero Flores, Perfecto Malaquias 2013-03-19 Montpellier 2 Laurent, Anne
collection NDLTD
language en
sources NDLTD
topic Fouille de donnees
Logique floue
Parallelisation
Bases de donnees
Data mining
Fuzzy logic
Parallelization
Databases

spellingShingle Fouille de donnees
Logique floue
Parallelisation
Bases de donnees
Data mining
Fuzzy logic
Parallelization
Databases

Quintero Flores, Perfecto Malaquias
Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures
description Les motifs graduels visent à décrire des co-variations au sein des données et sont de la forme plus l'âge est important, plus le salaire est élevé. Ces motifs ont fait l'objet de nombreux travaux en fouille de données ces dernières années, du point de vue des définitions que peuvent avoir de tels motifs et d'un point de vue algorithmique pour les extraire efficacement. Ces définitions et algorithmes considèrent qu'il est possible d'ordonner de manière stricte les valeurs (par exemple l'âge, le salaire). Or, dans de nombreux champs applicatifs, il est difficile voire impossible d'ordonner de cette manière. Par exemple, quand l'on considère l'expression de gènes, dire que l'expression d'un gène est plus importante que l'expression d'un autre gène quand leurs expressions ne diffèrent qu'à la dixième décimale n'a pas de sens d'un point de vue biologique. Ainsi, nous proposons dans cette thèse une approche fondée sur les ordres flous. Les algorithmes étant très consommateurs tant en mémoire qu'en temps de calcul, nous proposons des optimisations d'une part du stockage des degrés flous et d'autre part de calcul parallélisé. Les expérimentations que nous avons menées sur des bases de données synthétiques et réelles montrent l'intérêt de notre approche. === Gradual patterns aim at describing co-variations of data such as the older, the higher the salary. They have been more and more studied from the data mining point of view in recent years, leading to several ways of defining their meaning and and several algorithms to automatically extract them.They consider that data can be ordered regarding the values taken on the attributes (e.g. the age and the salary).However, in many application domains, it is hardly possible to consider that data values are crisply ordered. For instance, when considering gene expression, it is not true, from the biological point of view, to say that Gene 1 is more expressed than Gene 2 if the levels of expression only differ from the tenth decimal. This thesis thus considers fuzzy orderings and propose both formal definitions and algorithms to extract gradual patterns considering fuzzy orderings. As these algorithms are both time and memory consuming, we propose some optimizations based on an efficient storage of the fuzzy ordering informationcoupled with parallel algorithms. Experimental results run on synthetic and real database show the interest or our proposal.
author2 Montpellier 2
author_facet Montpellier 2
Quintero Flores, Perfecto Malaquias
author Quintero Flores, Perfecto Malaquias
author_sort Quintero Flores, Perfecto Malaquias
title Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures
title_short Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures
title_full Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures
title_fullStr Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures
title_full_unstemmed Fuzzy Gradual Pattern Mining Based on Multi-Core Architectures
title_sort fuzzy gradual pattern mining based on multi-core architectures
publishDate 2013
url http://www.theses.fr/2013MON20232/document
work_keys_str_mv AT quinterofloresperfectomalaquias fuzzygradualpatternminingbasedonmulticorearchitectures
AT quinterofloresperfectomalaquias fouilledemotifsgraduelsflousbaseesurarchitecturesmulticoeur
_version_ 1719204200544468992