Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension

Acquérir et traiter des données est de moins en moins coûteux, à la fois en matériel et en temps, mais encore faut-il pouvoir les analyser et les interpréter malgré leur complexité. La dimensionnalité est un des aspects de cette complexité intrinsèque. Pour aider à interpréter et à appréhender ces d...

Full description

Bibliographic Details
Main Author: Heulot, Nicolas
Other Authors: Paris 11
Language:fr
Published: 2014
Subjects:
Online Access:http://www.theses.fr/2014PA112127
id ndltd-theses.fr-2014PA112127
record_format oai_dc
spelling ndltd-theses.fr-2014PA1121272017-06-30T04:44:28Z Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension Study of multidimensional scaling as an interactive visualization to help the visual analysis of high dimensional data Visualisation d’information Fouille visuelle de données Données de grande dimension Projection de données Information Visualization Visual Analytics High-Dimensional Data Multidimensional Scaling Acquérir et traiter des données est de moins en moins coûteux, à la fois en matériel et en temps, mais encore faut-il pouvoir les analyser et les interpréter malgré leur complexité. La dimensionnalité est un des aspects de cette complexité intrinsèque. Pour aider à interpréter et à appréhender ces données le recours à la visualisation est indispensable au cours du processus d’analyse. La projection représente les données sous forme d’un nuage de points 2D, indépendamment du nombre de dimensions. Cependant cette technique de visualisation souffre de distorsions dues à la réduction de dimension, ce qui pose des problèmes d’interprétation et de confiance. Peu d’études ont été consacrées à la considération de l’impact de ces artefacts, ainsi qu’à la façon dont des utilisateurs non-familiers de ces techniques peuvent analyser visuellement une projection. L’approche soutenue dans cette thèse repose sur la prise en compte interactive des artefacts, afin de permettre à des analystes de données ou des non-experts de réaliser de manière fiable les tâches d’analyse visuelle des projections. La visualisation interactive des proximités colore la projection en fonction des proximités d’origine par rapport à une donnée de référence dans l’espace des données. Cette technique permet interactivement de révéler les artefacts de projection pour aider à appréhender les détails de la structure sous-jacente aux données. Dans cette thèse, nous revisitons la conception de cette technique et présentons ses apports au travers de deux expérimentations contrôlées qui étudient l’impact des artefacts sur l’analyse visuelle des projections. Nous présentons également une étude de l’espace de conception d’une technique basée sur la métaphore de lentille et visant à s’affranchir localement des problématiques d’artefacts de projection. The cost of data acquisition and processing has radically decreased in both material and time. But we also need to analyze and interpret the large amounts of complex data that are stored. Dimensionality is one aspect of their intrinsic complexity. Visualization is essential during the analysis process to help interpreting and understanding these data. Projection represents data as a 2D scatterplot, regardless the amount of dimensions. However, this visualization technique suffers from artifacts due to the dimensionality reduction. Its lack of reliability implies issues of interpretation and trust. Few studies have been devoted to the consideration of the impact of these artifacts, and especially to give feedbacks on how non-expert users can visually analyze projections. The main approach of this thesis relies on an taking these artifacts into account using interactive techniques, in order to allow data scientists or non-expert users to perform a trustworthy visual analysis of projections. The interactive visualization of the proximities applies a coloring of the original proximities relatives to a reference in the data-space. This interactive technique allows revealing projection artifacts in order to help grasping details of the underlying data-structure. In this thesis, we redesign this technique and we demonstrate its potential by presenting two controlled experiments studying the impact of artifacts on the visual analysis of projections. We also present a design-space based on the lens metaphor, in order to improve this technique and to locally visualize a projection free of artifacts issues. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2014PA112127 Heulot, Nicolas 2014-07-04 Paris 11 Aupetit, Michaël Fekete, Jean-Daniel
collection NDLTD
language fr
sources NDLTD
topic Visualisation d’information
Fouille visuelle de données
Données de grande dimension
Projection de données
Information Visualization
Visual Analytics
High-Dimensional Data
Multidimensional Scaling

spellingShingle Visualisation d’information
Fouille visuelle de données
Données de grande dimension
Projection de données
Information Visualization
Visual Analytics
High-Dimensional Data
Multidimensional Scaling

Heulot, Nicolas
Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
description Acquérir et traiter des données est de moins en moins coûteux, à la fois en matériel et en temps, mais encore faut-il pouvoir les analyser et les interpréter malgré leur complexité. La dimensionnalité est un des aspects de cette complexité intrinsèque. Pour aider à interpréter et à appréhender ces données le recours à la visualisation est indispensable au cours du processus d’analyse. La projection représente les données sous forme d’un nuage de points 2D, indépendamment du nombre de dimensions. Cependant cette technique de visualisation souffre de distorsions dues à la réduction de dimension, ce qui pose des problèmes d’interprétation et de confiance. Peu d’études ont été consacrées à la considération de l’impact de ces artefacts, ainsi qu’à la façon dont des utilisateurs non-familiers de ces techniques peuvent analyser visuellement une projection. L’approche soutenue dans cette thèse repose sur la prise en compte interactive des artefacts, afin de permettre à des analystes de données ou des non-experts de réaliser de manière fiable les tâches d’analyse visuelle des projections. La visualisation interactive des proximités colore la projection en fonction des proximités d’origine par rapport à une donnée de référence dans l’espace des données. Cette technique permet interactivement de révéler les artefacts de projection pour aider à appréhender les détails de la structure sous-jacente aux données. Dans cette thèse, nous revisitons la conception de cette technique et présentons ses apports au travers de deux expérimentations contrôlées qui étudient l’impact des artefacts sur l’analyse visuelle des projections. Nous présentons également une étude de l’espace de conception d’une technique basée sur la métaphore de lentille et visant à s’affranchir localement des problématiques d’artefacts de projection. === The cost of data acquisition and processing has radically decreased in both material and time. But we also need to analyze and interpret the large amounts of complex data that are stored. Dimensionality is one aspect of their intrinsic complexity. Visualization is essential during the analysis process to help interpreting and understanding these data. Projection represents data as a 2D scatterplot, regardless the amount of dimensions. However, this visualization technique suffers from artifacts due to the dimensionality reduction. Its lack of reliability implies issues of interpretation and trust. Few studies have been devoted to the consideration of the impact of these artifacts, and especially to give feedbacks on how non-expert users can visually analyze projections. The main approach of this thesis relies on an taking these artifacts into account using interactive techniques, in order to allow data scientists or non-expert users to perform a trustworthy visual analysis of projections. The interactive visualization of the proximities applies a coloring of the original proximities relatives to a reference in the data-space. This interactive technique allows revealing projection artifacts in order to help grasping details of the underlying data-structure. In this thesis, we redesign this technique and we demonstrate its potential by presenting two controlled experiments studying the impact of artifacts on the visual analysis of projections. We also present a design-space based on the lens metaphor, in order to improve this technique and to locally visualize a projection free of artifacts issues.
author2 Paris 11
author_facet Paris 11
Heulot, Nicolas
author Heulot, Nicolas
author_sort Heulot, Nicolas
title Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
title_short Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
title_full Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
title_fullStr Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
title_full_unstemmed Etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
title_sort etude des projections de données comme support interactif de l’analyse visuelle de la structure de données de grande dimension
publishDate 2014
url http://www.theses.fr/2014PA112127
work_keys_str_mv AT heulotnicolas etudedesprojectionsdedonneescommesupportinteractifdelanalysevisuelledelastructurededonneesdegrandedimension
AT heulotnicolas studyofmultidimensionalscalingasaninteractivevisualizationtohelpthevisualanalysisofhighdimensionaldata
_version_ 1718483763328974848