Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes

Um problema importante na área de Biologia Sistêmica é o de inferência de redes de regulação gênica. Os avanços científicos e tecnológicos nos permitem analisar a expressão gênica de milhares de genes simultaneamente. Por \"expressão gênica\'\', estamos nos referindo ao nível de mRNA...

Full description

Bibliographic Details
Main Author: Higa, Carlos Henrique Aguena
Other Authors: Hashimoto, Ronaldo Fumio
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2012
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45134/tde-06092012-144108/
id ndltd-usp.br-oai-teses.usp.br-tde-06092012-144108
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-06092012-1441082019-05-09T18:17:46Z Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes Inference of gene regulatory networks using the seed growing paradigm Higa, Carlos Henrique Aguena Boolean networks cadeia de Markov constraint satisfaction problems feature selection gene regulatory networks inference inferência de redes Markov chain problemas de satisfação de restrições redes Booleanas redes de regulação gênica seleção de características Um problema importante na área de Biologia Sistêmica é o de inferência de redes de regulação gênica. Os avanços científicos e tecnológicos nos permitem analisar a expressão gênica de milhares de genes simultaneamente. Por \"expressão gênica\'\', estamos nos referindo ao nível de mRNA dentro de uma célula. Devido a esta grande quantidade de dados, métodos matemáticos, estatísticos e computacionais têm sido desenvolvidos com o objetivo de elucidar os mecanismos de regulação gênica presentes nos organismos vivos. Para isso, modelos matemáticos de redes de regulação gênica têm sido propostos, assim como algoritmos para inferir estas redes. Neste trabalho, focamos nestes dois aspectos: modelagem e inferência. Com relação à modelagem, estudamos modelos existentes para o ciclo celular da levedura (Saccharomyces cerevisiae). Após este estudo, propomos um modelo baseado em redes Booleanas probabilísticas sensíveis ao contexto, e em seguida, um aprimoramento deste modelo, utilizando cadeias de Markov não homogêneas. Mostramos os resultados, comparando os nossos modelos com os modelos estudados. Com relação à inferência, propomos um novo algoritmo utilizando o paradigma de crescimento de semente de genes. Neste contexto, uma semente é um pequeno subconjunto de genes de interesse. Nosso algoritmo é baseado em dois passos: passo de crescimento de semente e passo de amostragem. No primeiro passo, o algoritmo adiciona outros genes à esta semente, seguindo algum critério. No segundo, o algoritmo realiza uma amostragem de redes, definindo como saída um conjunto de redes potencialmente interessantes. Aplicamos o algoritmo em dados artificiais e dados biológicos de células HeLa, mostrando resultados satisfatórios. A key problem in Systems Biology is the inference of gene regulatory networks. The scientific and technological advancement allow us to analyze the gene expression of thousands of genes, simultaneously. By \"gene expression\'\' we refer to the mRNA concentration level inside a cell. Due to this large amount of data, mathematical, statistical and computational methods have been developed in order to elucidate the gene regulatory mechanisms that take part of every living organism. To this end, mathematical models of gene regulatory networks have been proposed, along with algorithms to infer these networks. In this work, we focus in two aspects: modeling and inference. Regarding the modeling, we studied existing models for the yeast (Saccharomyces cerevisiae) cell cycle. After that, we proposed a model based on context sensitive probabilistic Boolean networks, and then, an improvement of this model, using nonhomogeneous Markov chain. We show the results, comparing our models against the studied models. Regarding the inference, we proposed a new algorithm using the seed growing paradigm. In this context, a seed is a small subset of genes. Our algorithm is based in two main steps: seed growing step and sampling step. In the first step, the algorithm adds genes into the seed, according to some criterion. In the second step, the algorithm performs a sampling process on the space of networks, defining as its output a set of potentially interesting networks. We applied the algorithm on artificial and biological HeLa cells data, showing satisfactory results. Biblioteca Digitais de Teses e Dissertações da USP Hashimoto, Ronaldo Fumio 2012-02-17 Tese de Doutorado application/pdf http://www.teses.usp.br/teses/disponiveis/45/45134/tde-06092012-144108/ pt Liberar o conteúdo para acesso público.
collection NDLTD
language pt
format Others
sources NDLTD
topic Boolean networks
cadeia de Markov
constraint satisfaction problems
feature selection
gene regulatory networks
inference
inferência de redes
Markov chain
problemas de satisfação de restrições
redes Booleanas
redes de regulação gênica
seleção de características
spellingShingle Boolean networks
cadeia de Markov
constraint satisfaction problems
feature selection
gene regulatory networks
inference
inferência de redes
Markov chain
problemas de satisfação de restrições
redes Booleanas
redes de regulação gênica
seleção de características
Higa, Carlos Henrique Aguena
Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
description Um problema importante na área de Biologia Sistêmica é o de inferência de redes de regulação gênica. Os avanços científicos e tecnológicos nos permitem analisar a expressão gênica de milhares de genes simultaneamente. Por \"expressão gênica\'\', estamos nos referindo ao nível de mRNA dentro de uma célula. Devido a esta grande quantidade de dados, métodos matemáticos, estatísticos e computacionais têm sido desenvolvidos com o objetivo de elucidar os mecanismos de regulação gênica presentes nos organismos vivos. Para isso, modelos matemáticos de redes de regulação gênica têm sido propostos, assim como algoritmos para inferir estas redes. Neste trabalho, focamos nestes dois aspectos: modelagem e inferência. Com relação à modelagem, estudamos modelos existentes para o ciclo celular da levedura (Saccharomyces cerevisiae). Após este estudo, propomos um modelo baseado em redes Booleanas probabilísticas sensíveis ao contexto, e em seguida, um aprimoramento deste modelo, utilizando cadeias de Markov não homogêneas. Mostramos os resultados, comparando os nossos modelos com os modelos estudados. Com relação à inferência, propomos um novo algoritmo utilizando o paradigma de crescimento de semente de genes. Neste contexto, uma semente é um pequeno subconjunto de genes de interesse. Nosso algoritmo é baseado em dois passos: passo de crescimento de semente e passo de amostragem. No primeiro passo, o algoritmo adiciona outros genes à esta semente, seguindo algum critério. No segundo, o algoritmo realiza uma amostragem de redes, definindo como saída um conjunto de redes potencialmente interessantes. Aplicamos o algoritmo em dados artificiais e dados biológicos de células HeLa, mostrando resultados satisfatórios. === A key problem in Systems Biology is the inference of gene regulatory networks. The scientific and technological advancement allow us to analyze the gene expression of thousands of genes, simultaneously. By \"gene expression\'\' we refer to the mRNA concentration level inside a cell. Due to this large amount of data, mathematical, statistical and computational methods have been developed in order to elucidate the gene regulatory mechanisms that take part of every living organism. To this end, mathematical models of gene regulatory networks have been proposed, along with algorithms to infer these networks. In this work, we focus in two aspects: modeling and inference. Regarding the modeling, we studied existing models for the yeast (Saccharomyces cerevisiae) cell cycle. After that, we proposed a model based on context sensitive probabilistic Boolean networks, and then, an improvement of this model, using nonhomogeneous Markov chain. We show the results, comparing our models against the studied models. Regarding the inference, we proposed a new algorithm using the seed growing paradigm. In this context, a seed is a small subset of genes. Our algorithm is based in two main steps: seed growing step and sampling step. In the first step, the algorithm adds genes into the seed, according to some criterion. In the second step, the algorithm performs a sampling process on the space of networks, defining as its output a set of potentially interesting networks. We applied the algorithm on artificial and biological HeLa cells data, showing satisfactory results.
author2 Hashimoto, Ronaldo Fumio
author_facet Hashimoto, Ronaldo Fumio
Higa, Carlos Henrique Aguena
author Higa, Carlos Henrique Aguena
author_sort Higa, Carlos Henrique Aguena
title Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
title_short Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
title_full Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
title_fullStr Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
title_full_unstemmed Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
title_sort inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2012
url http://www.teses.usp.br/teses/disponiveis/45/45134/tde-06092012-144108/
work_keys_str_mv AT higacarloshenriqueaguena inferenciaderedesderegulacaogenicautilizandooparadigmadecrescimentodesementes
AT higacarloshenriqueaguena inferenceofgeneregulatorynetworksusingtheseedgrowingparadigm
_version_ 1719053977484525568