3D-Tri : um algoritmo de indu??o de ?rvore de regress?o para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor

Made available in DSpace on 2015-04-14T14:49:41Z (GMT). No. of bitstreams: 1 436381.pdf: 5238803 bytes, checksum: ca22d61f2fb4075e277ed531aee231ce (MD5) Previous issue date: 2012-01-17 === With the growth of biological experiments, solving and analyzing the massive amount of data being generated h...

Full description

Bibliographic Details
Main Author: Winck, Ana Trindade
Other Authors: Ruiz, Duncan Dubugras Alcoba
Format: Others
Language:Portuguese
Published: Pontif?cia Universidade Cat?lica do Rio Grande do Sul 2015
Subjects:
Online Access:http://tede2.pucrs.br/tede2/handle/tede/5156
Description
Summary:Made available in DSpace on 2015-04-14T14:49:41Z (GMT). No. of bitstreams: 1 436381.pdf: 5238803 bytes, checksum: ca22d61f2fb4075e277ed531aee231ce (MD5) Previous issue date: 2012-01-17 === With the growth of biological experiments, solving and analyzing the massive amount of data being generated has been one of the challenges in bioinformatics, where one important research area is the rational drug design (RDD). The interaction between biological macromolecules called receptors, and small molecules called ligands, is the fundamental principle of RDD. In in-silico molecular docking experiments it is investigated the best bind and conformation of a ligand into a receptor. A docking result can be discriminated by a continue value called Free Energy of Binding (FEB). We are attempting on mining data from molecular docking results, aiming at selecting promising receptor conformations to the next docking experiments. In this sense, we have developed a comprehensive repository to store our molecular docking data. Having such repository, we were able to apply preprocessing strategies on the stored data and submit them to different data mining tasks. Among the techniques applied, the most promising results were obtained with regression model trees. Although we have already addressed important issues and achieved significant results, there are some properties in these experiments turning it difficult to properly select conformations. Hence, a strategy was proposed considering the three-dimensional (3D) properties of the receptor conformations, to predict FEB. This thesis presents the 3D-Tri, a novel algorithm able to handle and treat spatial coordinates in a x,y,z format, and induce a tree that predicts FEB value by representing such properties. The algorithm uses such coordinates to split a node in two parts, where the edges evaluate whether the atom being tested by the node is part of a given interval [(xi,xf );(yi,yf );(zi,zf )], where i indicates the initial position of the coordinate, and f its final position. The induced model can help a domain specialist to select promising conformations, based on the region of the atoms in the model, to perform new molecular docking experiments === Com o avan?o nos experimentos biol?gicos, a manipula??o e an?lise do grande volume de dadossendo gerados por esses experimentos t?m sido um dos desafios em bioinform?tica, onde umaimportante ?rea de pesquisa ? o desenho racional de f?rmacos (RDD - Rational Drug Desing). Aintera??o entre macromol?culas biol?gicas, chamadas de receptores, e pequenas mol?culas, chamadasligantes, ? o princ?pio fundamental do RDD. ? em experimentos in silico de docagem molecularque se investiga o melhor encaixe e conforma??o de um ligante em uma cavidade do receptor. Oresultado de um experimento de docagem pode ser avaliado a partir de um valor cont?nuo de energialivre de liga??o (FEB - Free Energy of Binding). Tem-se empregado esfor?os em minerar dados deresultados de docagem molecular, com o objetivo de selecionar conforma??es relevantes para reduziro tempo de futuros experimentos de docagem. Nesse sentido, foi desenvolvido um reposit?rio paraarmazenar todos os dados a respeito desses experimentos, em n?vel de detalhe. Com esse reposit?rio,os dados foram devidamente pr?-processados e submetidos a diferentes tarefas de minera??ode dados. Dentre as t?cnicas aplicadas, a que apresentou-se mais promissora para o tipo de dadossendo utilizado foi ?rvore de decis?o para regress?o. Apesar dos resultados alcan?ados por essesexperimentos serem promissores, existem algumas propriedades nos experimentos que dificultam aefetiva sele??o de conforma??es. Dessa forma, prop?e-se uma estrat?gia que considera as propriedadestridimensionais (3D) do receptor para predizer o valor de FEB. Assim, nesta Tese ? apresentadoo 3D-Tri, um algoritmo de indu??o de ?rvore de regress?o que considera essas propriedades 3D,onde essas propriedades s?o definidas como atributos no formato x,y,z. O algoritmo proposto fazuso dessas coordenadas para dividir um nodo em duas partes, onde o ?tomo sendo testado parao nodo ? avaliado em termos de sua posi??o em um bloco [(xi,xf );(yi,yf );(zi,zf )] que melhorrepresente sua posi??o no espa?o, onde i indica a posi??o inicial de uma coordenada, e f indicaa posi??o final. O modelo induzido pode ser ?til para um especialista de dom?nio para selecionarconforma??es promissoras do receptor, tendo como base as regi?es dos ?tomos que aparecem nomodelo e que indicam melhores valores de FEB