Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade

As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma...

Full description

Bibliographic Details
Main Author: Manfredini, Ricardo Augusto
Other Authors: Ferreira, Henrique Bunselmeyer
Language:Portuguese
Published: 2015
Subjects:
Online Access:https://repositorio.ucs.br/handle/11338/1061
id ndltd-IBICT-oai-vkali40.ucs.br-11338-1061
record_format oai_dc
spelling ndltd-IBICT-oai-vkali40.ucs.br-11338-10612018-05-23T23:16:47Z Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade Manfredini, Ricardo Augusto Ferreira, Henrique Bunselmeyer Delamare, Ana Paula Longaray Silva, Scheila de Ávila e Echeverrigaray, Sérgio Genoma Microorganismos Biotecnologia Genomes Microorganisms Biotechnology As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos. Submitted by Ana Guimarães Pereira (agpereir@ucs.br) on 2015-11-17T13:29:43Z No. of bitstreams: 1 Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) Made available in DSpace on 2015-11-17T13:29:43Z (GMT). No. of bitstreams: 1 Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms. 2015-11-17T13:29:43Z 2015-11-17T13:29:43Z 2015-11-17 2015-04-27 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis https://repositorio.ucs.br/handle/11338/1061 por info:eu-repo/semantics/openAccess reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul instacron:UCS
collection NDLTD
language Portuguese
sources NDLTD
topic Genoma
Microorganismos
Biotecnologia
Genomes
Microorganisms
Biotechnology
spellingShingle Genoma
Microorganismos
Biotecnologia
Genomes
Microorganisms
Biotechnology
Manfredini, Ricardo Augusto
Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
description As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos. === Submitted by Ana Guimarães Pereira (agpereir@ucs.br) on 2015-11-17T13:29:43Z No. of bitstreams: 1 Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) === Made available in DSpace on 2015-11-17T13:29:43Z (GMT). No. of bitstreams: 1 Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) === Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms.
author2 Ferreira, Henrique Bunselmeyer
author_facet Ferreira, Henrique Bunselmeyer
Manfredini, Ricardo Augusto
author Manfredini, Ricardo Augusto
author_sort Manfredini, Ricardo Augusto
title Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
title_short Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
title_full Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
title_fullStr Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
title_full_unstemmed Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
title_sort desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
publishDate 2015
url https://repositorio.ucs.br/handle/11338/1061
work_keys_str_mv AT manfrediniricardoaugusto desenvolvimentoevalidacaodemetododeanalisedesequenciasgenomicasbaseadaempadroesdeentropiacoeficientedeclusterizacaoeperiodicidade
_version_ 1718669317284823040