Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance

Cette thèse présente de nouveaux tests d’hypothèses statistiques efficaces pour la relative similarité et dépendance, et l’estimation de la matrice de précision. La principale méthodologie adoptée dans cette thèse est la classe des estimateurs U-statistiques.Le premier test statistique porte sur les...

Full description

Bibliographic Details
Main Author: Bounliphone, Wacha
Other Authors: Université Paris-Saclay (ComUE)
Language:fr
en
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017SACLC002/document
id ndltd-theses.fr-2017SACLC002
record_format oai_dc
collection NDLTD
language fr
en
sources NDLTD
topic U-statistiques
Tests d’hypothèses statistiques
Dépendance
Similarité
Méthodes à noyau
U-statistics
Hypothesis testing
Dependency
Similarity
Kernel methods

spellingShingle U-statistiques
Tests d’hypothèses statistiques
Dépendance
Similarité
Méthodes à noyau
U-statistics
Hypothesis testing
Dependency
Similarity
Kernel methods

Bounliphone, Wacha
Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
description Cette thèse présente de nouveaux tests d’hypothèses statistiques efficaces pour la relative similarité et dépendance, et l’estimation de la matrice de précision. La principale méthodologie adoptée dans cette thèse est la classe des estimateurs U-statistiques.Le premier test statistique porte sur les tests de relative similarité appliqués au problème de la sélection de modèles. Les modèles génératifs probabilistes fournissent un cadre puissant pour représenter les données. La sélection de modèles dans ce contexte génératif peut être difficile. Pour résoudre ce problème, nous proposons un nouveau test d’hypothèse non paramétrique de relative similarité et testons si un premier modèle candidat génère un échantillon de données significativement plus proche d’un ensemble de validation de référence.La deuxième test d’hypothèse statistique non paramétrique est pour la relative dépendance. En présence de dépendances multiples, les méthodes existantes ne répondent qu’indirectement à la question de la relative dépendance. Or, savoir si une dépendance est plus forte qu’une autre est important pour la prise de décision. Nous présentons un test statistique qui détermine si une variable dépend beaucoup plus d’une première variable cible ou d’une seconde variable.Enfin, une nouvelle méthode de découverte de structure dans un modèle graphique est proposée. En partant du fait que les zéros d’une matrice de précision représentent les indépendances conditionnelles, nous développons un nouveau test statistique qui estime une borne pour une entrée de la matrice de précision. Les méthodes existantes de découverte de structure font généralement des hypothèses restrictives de distributions gaussiennes ou parcimonieuses qui ne correspondent pas forcément à l’étude de données réelles. Nous introduisons ici un nouveau test utilisant les propriétés des U-statistics appliqués à la matrice de covariance, et en déduisons une borne sur la matrice de précision. === The dissertation presents novel statistically and computationally efficient hypothesis tests for relative similarity and dependency, and precision matrix estimation. The key methodology adopted in this thesis is the class of U-statistic estimators. The class of U-statistics results in a minimum-variance unbiased estimation of a parameter.The first part of the thesis focuses on relative similarity tests applied to the problem of model selection. Probabilistic generative models provide a powerful framework for representing data. Model selection in this generative setting can be challenging. To address this issue, we provide a novel non-parametric hypothesis test of relative similarity and test whether a first candidate model generates a data sample significantly closer to a reference validation set.Subsequently, the second part of the thesis focuses on developing a novel non-parametric statistical hypothesis test for relative dependency. Tests of dependence are important tools in statistical analysis, and several canonical tests for the existence of dependence have been developed in the literature. However, the question of whether there exist dependencies is secondary. The determination of whether one dependence is stronger than another is frequently necessary for decision making. We present a statistical test which determine whether one variables is significantly more dependent on a first target variable or a second.Finally, a novel method for structure discovery in a graphical model is proposed. Making use of a result that zeros of a precision matrix can encode conditional independencies, we develop a test that estimates and bounds an entry of the precision matrix. Methods for structure discovery in the literature typically make restrictive distributional (e.g. Gaussian) or sparsity assumptions that may not apply to a data sample of interest. Consequently, we derive a new test that makes use of results for U-statistics and applies them to the covariance matrix, which then implies a bound on the precision matrix.
author2 Université Paris-Saclay (ComUE)
author_facet Université Paris-Saclay (ComUE)
Bounliphone, Wacha
author Bounliphone, Wacha
author_sort Bounliphone, Wacha
title Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
title_short Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
title_full Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
title_fullStr Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
title_full_unstemmed Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
title_sort tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance
publishDate 2017
url http://www.theses.fr/2017SACLC002/document
work_keys_str_mv AT bounliphonewacha testsdhypothesesstatistiquementetalgorithmiquementefficacesdesimilariteetdedependance
AT bounliphonewacha statisticallyandcomputationallyefficienthypothesistestsforsimilarityanddependency
_version_ 1719311290862665728
spelling ndltd-theses.fr-2017SACLC0022020-02-03T15:25:10Z Tests d’hypothèses statistiquement et algorithmiquement efficaces de similarité et de dépendance Statistically and computationally efficient hypothesis tests for similarity and dependency U-statistiques Tests d’hypothèses statistiques Dépendance Similarité Méthodes à noyau U-statistics Hypothesis testing Dependency Similarity Kernel methods Cette thèse présente de nouveaux tests d’hypothèses statistiques efficaces pour la relative similarité et dépendance, et l’estimation de la matrice de précision. La principale méthodologie adoptée dans cette thèse est la classe des estimateurs U-statistiques.Le premier test statistique porte sur les tests de relative similarité appliqués au problème de la sélection de modèles. Les modèles génératifs probabilistes fournissent un cadre puissant pour représenter les données. La sélection de modèles dans ce contexte génératif peut être difficile. Pour résoudre ce problème, nous proposons un nouveau test d’hypothèse non paramétrique de relative similarité et testons si un premier modèle candidat génère un échantillon de données significativement plus proche d’un ensemble de validation de référence.La deuxième test d’hypothèse statistique non paramétrique est pour la relative dépendance. En présence de dépendances multiples, les méthodes existantes ne répondent qu’indirectement à la question de la relative dépendance. Or, savoir si une dépendance est plus forte qu’une autre est important pour la prise de décision. Nous présentons un test statistique qui détermine si une variable dépend beaucoup plus d’une première variable cible ou d’une seconde variable.Enfin, une nouvelle méthode de découverte de structure dans un modèle graphique est proposée. En partant du fait que les zéros d’une matrice de précision représentent les indépendances conditionnelles, nous développons un nouveau test statistique qui estime une borne pour une entrée de la matrice de précision. Les méthodes existantes de découverte de structure font généralement des hypothèses restrictives de distributions gaussiennes ou parcimonieuses qui ne correspondent pas forcément à l’étude de données réelles. Nous introduisons ici un nouveau test utilisant les propriétés des U-statistics appliqués à la matrice de covariance, et en déduisons une borne sur la matrice de précision. The dissertation presents novel statistically and computationally efficient hypothesis tests for relative similarity and dependency, and precision matrix estimation. The key methodology adopted in this thesis is the class of U-statistic estimators. The class of U-statistics results in a minimum-variance unbiased estimation of a parameter.The first part of the thesis focuses on relative similarity tests applied to the problem of model selection. Probabilistic generative models provide a powerful framework for representing data. Model selection in this generative setting can be challenging. To address this issue, we provide a novel non-parametric hypothesis test of relative similarity and test whether a first candidate model generates a data sample significantly closer to a reference validation set.Subsequently, the second part of the thesis focuses on developing a novel non-parametric statistical hypothesis test for relative dependency. Tests of dependence are important tools in statistical analysis, and several canonical tests for the existence of dependence have been developed in the literature. However, the question of whether there exist dependencies is secondary. The determination of whether one dependence is stronger than another is frequently necessary for decision making. We present a statistical test which determine whether one variables is significantly more dependent on a first target variable or a second.Finally, a novel method for structure discovery in a graphical model is proposed. Making use of a result that zeros of a precision matrix can encode conditional independencies, we develop a test that estimates and bounds an entry of the precision matrix. Methods for structure discovery in the literature typically make restrictive distributional (e.g. Gaussian) or sparsity assumptions that may not apply to a data sample of interest. Consequently, we derive a new test that makes use of results for U-statistics and applies them to the covariance matrix, which then implies a bound on the precision matrix. Electronic Thesis or Dissertation Text fr en http://www.theses.fr/2017SACLC002/document Bounliphone, Wacha 2017-01-30 Université Paris-Saclay (ComUE) Katholieke universiteit te Leuven (1970-....) Tenenhaus, Arthur Blaschko, Matthew B.