Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle

Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd&...

Full description

Bibliographic Details
Main Author: Guedj, Mickael
Language:FRE
Published: Université d'Evry-Val d'Essonne 2007
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00169411
http://tel.archives-ouvertes.fr/docs/00/16/94/11/PDF/M.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00169411
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-001694112013-01-07T18:44:17Z http://tel.archives-ouvertes.fr/tel-00169411 http://tel.archives-ouvertes.fr/docs/00/16/94/11/PDF/M.pdf Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle Guedj, Mickael [SDV] Life Sciences Génétique Statistique association déséquilibre de liaison épidémiologie score local test-multiple modèle de mélange puissance modélisation simulation Bioinformatique Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd'hui de nouvelles perspectives statistiques et informatiques nécessaires à leur analyse, constituant le principal axe de recherche de cette thèse.<br />Après une description introductive des principales problématiques liées aux études d'association à grande échelle, nous abordons plus particulièrement les approches simple-marqueur avec une étude de puissance des principaux tests d'association, ainsi que de leur combinaisons. Nous considérons ensuite l'utilisation d'approches multi-marqueurs avec le développement d'une méthode d'analyse fondée à partir de la statistique du Score Local. Celle-ci permet d'identifier des associations statistiques à partir de régions génomiques complètes, et non plus des marqueurs pris individuellement. Il s'agit d'une méthode simple, rapide et flexible pour laquelle nous évaluons les performances sur des données d'association à grande échelle simulées et réelles. Enfin ce travail traite également du problème du test-multiple, lié aux nombre de tests à réaliser lors de l'analyse de données génétiques ou génomiques haut-débit. La méthode que nous proposons à partir du Score Local prend en compte ce problème. Nous évoquons par ailleurs l'estimation du Local False Discovery Rate à travers un simple modèle de mélange gaussien.<br />L'ensemble des méthodes décrites dans ce manuscrit ont été implémentées à travers trois logiciels disponibles sur le site du laboratoire Statistique et Génome : fueatest, LHiSA et kerfdr. 2007-07-13 FRE PhD thesis Université d'Evry-Val d'Essonne
collection NDLTD
language FRE
sources NDLTD
topic [SDV] Life Sciences
Génétique
Statistique
association
déséquilibre de liaison
épidémiologie
score local
test-multiple
modèle de mélange
puissance
modélisation
simulation
Bioinformatique
spellingShingle [SDV] Life Sciences
Génétique
Statistique
association
déséquilibre de liaison
épidémiologie
score local
test-multiple
modèle de mélange
puissance
modélisation
simulation
Bioinformatique
Guedj, Mickael
Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle
description Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd'hui de nouvelles perspectives statistiques et informatiques nécessaires à leur analyse, constituant le principal axe de recherche de cette thèse.<br />Après une description introductive des principales problématiques liées aux études d'association à grande échelle, nous abordons plus particulièrement les approches simple-marqueur avec une étude de puissance des principaux tests d'association, ainsi que de leur combinaisons. Nous considérons ensuite l'utilisation d'approches multi-marqueurs avec le développement d'une méthode d'analyse fondée à partir de la statistique du Score Local. Celle-ci permet d'identifier des associations statistiques à partir de régions génomiques complètes, et non plus des marqueurs pris individuellement. Il s'agit d'une méthode simple, rapide et flexible pour laquelle nous évaluons les performances sur des données d'association à grande échelle simulées et réelles. Enfin ce travail traite également du problème du test-multiple, lié aux nombre de tests à réaliser lors de l'analyse de données génétiques ou génomiques haut-débit. La méthode que nous proposons à partir du Score Local prend en compte ce problème. Nous évoquons par ailleurs l'estimation du Local False Discovery Rate à travers un simple modèle de mélange gaussien.<br />L'ensemble des méthodes décrites dans ce manuscrit ont été implémentées à travers trois logiciels disponibles sur le site du laboratoire Statistique et Génome : fueatest, LHiSA et kerfdr.
author Guedj, Mickael
author_facet Guedj, Mickael
author_sort Guedj, Mickael
title Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle
title_short Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle
title_full Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle
title_fullStr Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle
title_full_unstemmed Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle
title_sort méthodes statistiques pour l'analyse de données génétiques d'association à grande echelle
publisher Université d'Evry-Val d'Essonne
publishDate 2007
url http://tel.archives-ouvertes.fr/tel-00169411
http://tel.archives-ouvertes.fr/docs/00/16/94/11/PDF/M.pdf
work_keys_str_mv AT guedjmickael methodesstatistiquespourlanalysededonneesgenetiquesdassociationagrandeechelle
_version_ 1716453784487460864