Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues

L’émergence des méthodes de déréplication comme moyen d’identification rapide des substances naturelles connues implique le développement conjoint d’outils informatiques dédiés au traitement et à l’analyse des données spectrales. Dans ce contexte, les travaux présentés dans ce mémoire ont porté sur...

Full description

Bibliographic Details
Main Author: Bakiri, Ali
Other Authors: Reims
Language:fr
Published: 2018
Subjects:
Rmn
Nmr
Online Access:http://www.theses.fr/2018REIMS013
id ndltd-theses.fr-2018REIMS013
record_format oai_dc
spelling ndltd-theses.fr-2018REIMS0132019-05-25T03:33:19Z Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues Development of chemometric tools for the classification of spectroscopic data and dereplication of algae metabolites Chémoinformatique Métabolomique Spécroscopie Chimiométrie Algues Rmn Chemoinformatics Metabolomics NMR spectroscopie Chemometrics Algae Nmr 541.3 L’émergence des méthodes de déréplication comme moyen d’identification rapide des substances naturelles connues implique le développement conjoint d’outils informatiques dédiés au traitement et à l’analyse des données spectrales. Dans ce contexte, les travaux présentés dans ce mémoire ont porté sur le développement de deux méthodes in silico de déréplication par résonance magnétique nucléaire (RMN). La première méthode, DerepCrud, permet l’identification des molécules naturelles à partir d’extraits naturels bruts en utilisant des données de RMN du 13C. La méthode permet de comparer des spectres de RMN 1D du 13C issus de l’analyse d’un extrait naturel à ceux des molécules naturelles répertoriées dans une base de données locale afin de pouvoir identifier les composés majoritaires. La deuxième méthode, BCNet, permet d’exploiter les données RMN bidimensionnelles (HMBC et HSQC) pour la déréplication de molécules naturelles. L’algorithme construit un réseau de corrélations HMBC formés par les signaux appartenant aux différentes molécules constituant un extrait puis isole les signaux de chaque molécule grâce à l’utilisation d’algorithmes de détection de communautés. Les molécules sont enfin identifiées en effectuant une recherche dans la base de données des corrélations HMBC. A la fin de la procédure, la présence des molécules identifiées est confirmée par une comparaison de leurs corrélations HSQC théoriques (aussi issues de la base de données) avec les corrélations expérimentales correspondantes afin de renforcer la précision de l’identification. The emergence of dereplication strategies as a new tool for the rapid identification of the natural products from complex natural extracts has unveiled a great need for cheminformatic tools for the treatment and analysis of the spectral data. The present thesis deals with the development of in silico dereplication methods based on Nuclear Magnetic Resonance (NMR). The first method, DerepCrud, is based on 13C NMR spectroscopy. It identifies the major compounds contained in a crude natural extract without any need for fractionation. The principle of the method is to compare the 13C NMR spectrum of the analyzed mixture to a series of 13C NMR chemical shifts of natural compounds stored in a local database. The second method, BCNet, is designed to exploit the richness of 2D NMR data (HMBC and HSQC) for the dereplication of the natural products. BCNet traces back the network formed by the HMBC correlations of the molecules present in a naturel extract, then isolates the groups of correlations belonging to the individual molecules using a community detection algorithm. The molecules are identified by searching these correlations within a locally constructed database that associates natural product structures and 2D NMR peak positions. Finally, the HSQC correlations of the molecules identified during the previous step are compared to the experimental HSQC correlations of the studied extract in order to increase the quality of identification accuracy. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2018REIMS013 Bakiri, Ali 2018-05-31 Reims Renault, Jean-Hugues Nuzillard, Jean-Marc
collection NDLTD
language fr
sources NDLTD
topic Chémoinformatique
Métabolomique
Spécroscopie
Chimiométrie
Algues
Rmn
Chemoinformatics
Metabolomics
NMR spectroscopie
Chemometrics
Algae
Nmr
541.3
spellingShingle Chémoinformatique
Métabolomique
Spécroscopie
Chimiométrie
Algues
Rmn
Chemoinformatics
Metabolomics
NMR spectroscopie
Chemometrics
Algae
Nmr
541.3
Bakiri, Ali
Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
description L’émergence des méthodes de déréplication comme moyen d’identification rapide des substances naturelles connues implique le développement conjoint d’outils informatiques dédiés au traitement et à l’analyse des données spectrales. Dans ce contexte, les travaux présentés dans ce mémoire ont porté sur le développement de deux méthodes in silico de déréplication par résonance magnétique nucléaire (RMN). La première méthode, DerepCrud, permet l’identification des molécules naturelles à partir d’extraits naturels bruts en utilisant des données de RMN du 13C. La méthode permet de comparer des spectres de RMN 1D du 13C issus de l’analyse d’un extrait naturel à ceux des molécules naturelles répertoriées dans une base de données locale afin de pouvoir identifier les composés majoritaires. La deuxième méthode, BCNet, permet d’exploiter les données RMN bidimensionnelles (HMBC et HSQC) pour la déréplication de molécules naturelles. L’algorithme construit un réseau de corrélations HMBC formés par les signaux appartenant aux différentes molécules constituant un extrait puis isole les signaux de chaque molécule grâce à l’utilisation d’algorithmes de détection de communautés. Les molécules sont enfin identifiées en effectuant une recherche dans la base de données des corrélations HMBC. A la fin de la procédure, la présence des molécules identifiées est confirmée par une comparaison de leurs corrélations HSQC théoriques (aussi issues de la base de données) avec les corrélations expérimentales correspondantes afin de renforcer la précision de l’identification. === The emergence of dereplication strategies as a new tool for the rapid identification of the natural products from complex natural extracts has unveiled a great need for cheminformatic tools for the treatment and analysis of the spectral data. The present thesis deals with the development of in silico dereplication methods based on Nuclear Magnetic Resonance (NMR). The first method, DerepCrud, is based on 13C NMR spectroscopy. It identifies the major compounds contained in a crude natural extract without any need for fractionation. The principle of the method is to compare the 13C NMR spectrum of the analyzed mixture to a series of 13C NMR chemical shifts of natural compounds stored in a local database. The second method, BCNet, is designed to exploit the richness of 2D NMR data (HMBC and HSQC) for the dereplication of the natural products. BCNet traces back the network formed by the HMBC correlations of the molecules present in a naturel extract, then isolates the groups of correlations belonging to the individual molecules using a community detection algorithm. The molecules are identified by searching these correlations within a locally constructed database that associates natural product structures and 2D NMR peak positions. Finally, the HSQC correlations of the molecules identified during the previous step are compared to the experimental HSQC correlations of the studied extract in order to increase the quality of identification accuracy.
author2 Reims
author_facet Reims
Bakiri, Ali
author Bakiri, Ali
author_sort Bakiri, Ali
title Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
title_short Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
title_full Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
title_fullStr Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
title_full_unstemmed Développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
title_sort développements informatiques de déréplication et de classification de données spectroscopiques pour le profilage métabolique d’extraits d'algues
publishDate 2018
url http://www.theses.fr/2018REIMS013
work_keys_str_mv AT bakiriali developpementsinformatiquesdedereplicationetdeclassificationdedonneesspectroscopiquespourleprofilagemetaboliquedextraitsdalgues
AT bakiriali developmentofchemometrictoolsfortheclassificationofspectroscopicdataanddereplicationofalgaemetabolites
_version_ 1719192669903650816