Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets

O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra espe...

Full description

Bibliographic Details
Main Author: Linhares, Raquel Romes
Other Authors: Lopes, Silvia Regina Costa
Format: Others
Language:Portuguese
Published: 2014
Subjects:
Online Access:http://hdl.handle.net/10183/86626
id ndltd-IBICT-oai-lume56.ufrgs.br-10183-86626
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Distribuicao de probabilidade
Sequencia dna mitocondrial
Flutuações
Wavelets : Construcao : Decomposicao
Probalidade
spellingShingle Distribuicao de probabilidade
Sequencia dna mitocondrial
Flutuações
Wavelets : Construcao : Decomposicao
Probalidade
Linhares, Raquel Romes
Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
description O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. === The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here.
author2 Lopes, Silvia Regina Costa
author_facet Lopes, Silvia Regina Costa
Linhares, Raquel Romes
author Linhares, Raquel Romes
author_sort Linhares, Raquel Romes
title Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
title_short Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
title_full Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
title_fullStr Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
title_full_unstemmed Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
title_sort longa dependência em sequências de dna : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets
publishDate 2014
url http://hdl.handle.net/10183/86626
work_keys_str_mv AT linharesraquelromes longadependenciaemsequenciasdednaanalisedeflutuacoesdestendenciadasteoriasdasdistribuicoesestaveisedewavelets
_version_ 1718751847294959616
spelling ndltd-IBICT-oai-lume56.ufrgs.br-10183-866262018-09-30T04:16:02Z Longa dependência em sequências de DNA : análise de flutuações destendenciadas, teorias das distribuições estáveis e de wavelets Linhares, Raquel Romes Lopes, Silvia Regina Costa Distribuicao de probabilidade Sequencia dna mitocondrial Flutuações Wavelets : Construcao : Decomposicao Probalidade O método da análise de flutuações destendenciadas (Detrended Fluctuation Analysis - DFA), proposto por Peng et al. (1994), é um exemplo de metodologia recente, sendo utilizada em um crescente número de aplicações, para identificar longa dependência em séries temporais. Como não existe uma regra específica para a escolha dos números de regressores no método de DFA, apresentamos aqui uma escolha ótima assintótica. Para um ruído Gaussiano fracionário, provamos que o estimador bHDFA tem distribuição Gaussiana exata e assintótica. O parâmetro mais importante para ser estimado em dados com caudas pesadas é a sua taxa de decaimento α que determina a probabilidade de ocorrência dos valores extremos da distribuição subjacente. Propomos, neste trabalho, um novo estimador para o parâmetro α, baseado na função característica empírica e no procedimento de encolhimento de wavelets. Estamos interessados em analisar a longa dependência em sequência de DNA utilizando a metodologia de mudança de regimes, proposta por Liu (2000). Nesta metodologia, se a duração dos regimes de uma série temporal tem uma distribuição de caudas pesadas com parâmetro α ∈ (1, 2), então a série temporal apresenta a característica de longa dependência. Além disso, aplicando-se qualquer transformação linear que preserva a propriedade de variância finita na série temporal, igualmente preservará a propriedade de longa dependência. Por fim, estudamos as distribuições de distâncias das regiões codantes e não codantes em sequências de DNA. Concluímos que todas as técnicas apresentadas neste trabalho, para analisar longa dependência em série temporais, envolvendo conceitos de análise de flutuações destendenciadas, distribuições com caudas pesadas e encolhimento de wavelets, mostram a existência de longa dependência em todas sequências de DNA aqui estudadas. The method of detrended fluctuation analysis (DFA), proposed by Peng et al. (1994), is useful in revealing the extent of long-range dependence in time series. Since there is not a specific rule for the choice of the numbers of regressors in DFA method, we present here an asymptotic optimal choice. For a fractional Gaussian noise, we prove the exact and the asymptotic Gaussian distributions for the bHDFA estimator. The most important parameter to estimate in a heavy-tailed data is the tail rate of decay α which determines the probability of occurrence of extreme values of the underlying distribution. Here we propose a novel estimator for α based on the empirical characteristic function and on the principal of wavelet shrinkage. Here we are interested in analyzing the long-range dependence in several DNA sequences, under the heavy-tail regime switching mechanism, proposed by Liu (2000). In this mechanism, if the duration of the regimes of a given time series has a heavy tail distribution with index parameter α ∈ (1, 2), then there is long-range dependence in this time series, and any functional transformation of the original time series preserving the property of finite variance, also preserves the property of long-range dependence. We also study the length distribution of coding and noncoding regions in DNA sequences. We conclude that all techniques presented in this paper to analyze longrange dependence in time series, involving concepts of detrended fluctuation analysis, heavy tail distributions and wavelet shrinkage, show the existence of long-range dependence in all DNA sequences studied here. 2014-01-23T01:53:07Z 2011 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10183/86626 000823194 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS