Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription

La méthode ChIP-seq est une technologie combinant la technique de chromatine immunoprecipitation avec le séquençage haut-débit et permettant l’analyse in vivo des facteurs de transcription à grande échelle. Le traitement des grandes quantités de données ainsi générées nécessite des moyens informatiq...

Full description

Bibliographic Details
Main Author: Mercier, Eloi
Other Authors: Gottardo, Raphael
Language:fr
Published: 2011
Subjects:
Online Access:http://hdl.handle.net/1866/6038
id ndltd-LACETR-oai-collectionscanada.gc.ca-QMU.1866-6038
record_format oai_dc
spelling ndltd-LACETR-oai-collectionscanada.gc.ca-QMU.1866-60382013-10-04T04:19:06ZDéveloppement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcriptionMercier, EloiGénétiqueRégulationFacteur de transcriptionChIP-seqGeneticsRegulationTranscription FactorsChIP-seqBiology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715)La méthode ChIP-seq est une technologie combinant la technique de chromatine immunoprecipitation avec le séquençage haut-débit et permettant l’analyse in vivo des facteurs de transcription à grande échelle. Le traitement des grandes quantités de données ainsi générées nécessite des moyens informatiques performants et de nombreux outils ont vu le jour récemment. Reste cependant que cette multiplication des logiciels réalisant chacun une étape de l’analyse engendre des problèmes de compatibilité et complique les analyses. Il existe ainsi un besoin important pour une suite de logiciels performante et flexible permettant l’identification des motifs. Nous proposons ici un ensemble complet d’analyse de données ChIP-seq disponible librement dans R et composé de trois modules PICS, rGADEM et MotIV. A travers l’analyse de quatre jeux de données des facteurs de transcription CTCF, STAT1, FOXA1 et ER nous avons démontré l’efficacité de notre ensemble d’analyse et mis en avant les fonctionnalités novatrices de celui-ci, notamment concernant le traitement des résultats par MotIV conduisant à la découverte de motifs non détectés par les autres algorithmes.ChIP-seq is a technology combining the chromatin immunoprecipitation method with high-throughput sequencing and allowing the analysis of transcription factors in vivo on a genome wide scale. The treatment of such amount of data generated by this method requires strong computer resources and new tools have been recently developed. Though this proliferation of software performing only one step of the analyze leads to compatibility problems and complicates the analysis. Thus, there is a real need for an integrated, powerful and flexible pipeline for motifs identification. Here we proposed a complete pipeline for the analysis of ChIP-seq data freely available in R and composed of three R packages PICS, rGADEM and MotIV. Analyzing four data sets for the human transcription factors CTCF, STAT1, FOXA1 and ER we demonstrated the efficiency of or pipeline and highlighted its new features, especially concerning the processing of the results by MotIV that led to the identification of motif not detected by other methods.Gottardo, Raphael2011-12-19T19:44:34ZNO_RESTRICTION2011-12-19T19:44:34Z2011-12-012011-10Thèse ou Mémoire numérique / Electronic Thesis or Dissertationhttp://hdl.handle.net/1866/6038fr
collection NDLTD
language fr
sources NDLTD
topic Génétique
Régulation
Facteur de transcription
ChIP-seq
Genetics
Regulation
Transcription Factors
ChIP-seq
Biology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715)
spellingShingle Génétique
Régulation
Facteur de transcription
ChIP-seq
Genetics
Regulation
Transcription Factors
ChIP-seq
Biology - Bioinformatics / Biologie - Bio-informatique (UMI : 0715)
Mercier, Eloi
Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription
description La méthode ChIP-seq est une technologie combinant la technique de chromatine immunoprecipitation avec le séquençage haut-débit et permettant l’analyse in vivo des facteurs de transcription à grande échelle. Le traitement des grandes quantités de données ainsi générées nécessite des moyens informatiques performants et de nombreux outils ont vu le jour récemment. Reste cependant que cette multiplication des logiciels réalisant chacun une étape de l’analyse engendre des problèmes de compatibilité et complique les analyses. Il existe ainsi un besoin important pour une suite de logiciels performante et flexible permettant l’identification des motifs. Nous proposons ici un ensemble complet d’analyse de données ChIP-seq disponible librement dans R et composé de trois modules PICS, rGADEM et MotIV. A travers l’analyse de quatre jeux de données des facteurs de transcription CTCF, STAT1, FOXA1 et ER nous avons démontré l’efficacité de notre ensemble d’analyse et mis en avant les fonctionnalités novatrices de celui-ci, notamment concernant le traitement des résultats par MotIV conduisant à la découverte de motifs non détectés par les autres algorithmes. === ChIP-seq is a technology combining the chromatin immunoprecipitation method with high-throughput sequencing and allowing the analysis of transcription factors in vivo on a genome wide scale. The treatment of such amount of data generated by this method requires strong computer resources and new tools have been recently developed. Though this proliferation of software performing only one step of the analyze leads to compatibility problems and complicates the analysis. Thus, there is a real need for an integrated, powerful and flexible pipeline for motifs identification. Here we proposed a complete pipeline for the analysis of ChIP-seq data freely available in R and composed of three R packages PICS, rGADEM and MotIV. Analyzing four data sets for the human transcription factors CTCF, STAT1, FOXA1 and ER we demonstrated the efficiency of or pipeline and highlighted its new features, especially concerning the processing of the results by MotIV that led to the identification of motif not detected by other methods.
author2 Gottardo, Raphael
author_facet Gottardo, Raphael
Mercier, Eloi
author Mercier, Eloi
author_sort Mercier, Eloi
title Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription
title_short Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription
title_full Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription
title_fullStr Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription
title_full_unstemmed Développement d’outils pour l’analyse de données de ChIP-seq et l’identification des facteurs de transcription
title_sort développement d’outils pour l’analyse de données de chip-seq et l’identification des facteurs de transcription
publishDate 2011
url http://hdl.handle.net/1866/6038
work_keys_str_mv AT merciereloi developpementdoutilspourlanalysededonneesdechipseqetlidentificationdesfacteursdetranscription
_version_ 1716602697325477888