Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade
As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
2015
|
Subjects: | |
Online Access: | https://repositorio.ucs.br/handle/11338/1061 |
id |
ndltd-IBICT-oai-vkali40.ucs.br-11338-1061 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-vkali40.ucs.br-11338-10612018-05-23T23:16:47Z Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade Manfredini, Ricardo Augusto Ferreira, Henrique Bunselmeyer Delamare, Ana Paula Longaray Silva, Scheila de Ávila e Echeverrigaray, Sérgio Genoma Microorganismos Biotecnologia Genomes Microorganisms Biotechnology As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos. Submitted by Ana Guimarães Pereira (agpereir@ucs.br) on 2015-11-17T13:29:43Z No. of bitstreams: 1 Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) Made available in DSpace on 2015-11-17T13:29:43Z (GMT). No. of bitstreams: 1 Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms. 2015-11-17T13:29:43Z 2015-11-17T13:29:43Z 2015-11-17 2015-04-27 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis https://repositorio.ucs.br/handle/11338/1061 por info:eu-repo/semantics/openAccess reponame:Repositório Institucional da UCS instname:Universidade de Caxias do Sul instacron:UCS |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Genoma Microorganismos Biotecnologia Genomes Microorganisms Biotechnology |
spellingShingle |
Genoma Microorganismos Biotecnologia Genomes Microorganisms Biotechnology Manfredini, Ricardo Augusto Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
description |
As sequências genômicas carregam uma ampla gama de informações sobre os organismos que a compõem. Obviamente, devido à grande semelhança destas informações e funções, espera-se que uma determinada sequência possa pertencer a muitos organismos, com probabilidades semelhantes. Entretanto, cada genoma carrega dentro de si certas peculiaridades que podem ser extraídas utilizando as ferramentas adequadas. Neste contexto, este trabalho propõe um processo de análise de sequências genômicas de bactérias, utilizando algumas medidas que são particularmente importantes: a entropia de triples (Sn), a quantificação da periodicidade 3 (P3) em uma sequência, o coeficiente de clusterização (D) e o percentual de GC. O processo aqui proposto nos permite inferir a qual organismo uma determinada sequência genômica pode pertencer, mostrando-se viável a sua utilização em metagenômica. Os resultados neste trabalho demonstram a eficácia deste método. Foram identificados 100% dos organismos presentes nas amostras estudadas (VP). Por outro lado, foi encontrado um grande número de organismos não pertencentes às amostras (FP), o que indica a grande similaridade de determinadas sequências, corroborando com alguns estudos que indicam que o genoma carrega consigo sequências órtologas, comuns a inúmeros organismos. === Submitted by Ana Guimarães Pereira (agpereir@ucs.br) on 2015-11-17T13:29:43Z
No. of bitstreams: 1
Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) === Made available in DSpace on 2015-11-17T13:29:43Z (GMT). No. of bitstreams: 1
Tese Ricardo Augusto Manfredini.pdf: 3422485 bytes, checksum: f6111d39384f0d874a1c4820a7faf475 (MD5) === Genomic sequences carry a wide range of information on organism that compose it. Obviously, by reason that great similarity of this information and functions, it is expected that each sequence can belong to many organisms with a similar probability. However, each genome carries within itself certain peculiarities that can be extracted using appropriate tools. In this context , this paper proposes a methodology for the analysis of genomic sequences of bacteria , using some measures that are particularly important : The entropy of triples ( Sn ) , the quantification of frequency 3 (P3) in a sequence , the clustering coefficient ( D ) and the percentage of GC . The method proposed here allows us to infer which a particular organism genome sequence may belong, being feasible for use in Metagenomics. The results of this study demonstrate the effectiveness of this method, 100 % of the organisms were identified in the samples studied (VP). On the other hand, a large number of bodies which did not belong samples were found (FP), which indicates the high similarity of certain sequences, corroborating some studies indicate that the genome carries ortholog sequences, common to countless organisms. |
author2 |
Ferreira, Henrique Bunselmeyer |
author_facet |
Ferreira, Henrique Bunselmeyer Manfredini, Ricardo Augusto |
author |
Manfredini, Ricardo Augusto |
author_sort |
Manfredini, Ricardo Augusto |
title |
Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
title_short |
Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
title_full |
Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
title_fullStr |
Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
title_full_unstemmed |
Desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
title_sort |
desenvolvimento e validação de método de análise de sequências genômicas baseada em padrões de entropia, coeficiente de clusterização e periodicidade |
publishDate |
2015 |
url |
https://repositorio.ucs.br/handle/11338/1061 |
work_keys_str_mv |
AT manfrediniricardoaugusto desenvolvimentoevalidacaodemetododeanalisedesequenciasgenomicasbaseadaempadroesdeentropiacoeficientedeclusterizacaoeperiodicidade |
_version_ |
1718669317284823040 |