Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos

Em ambientes dinâmicos e complexos, a política ótima de coordenação não pode ser derivada analiticamente, mas, deve ser aprendida através da interação direta com o ambiente. Geralmente, utiliza-se aprendizado por reforço para prover coordenação em tais ambientes. Atualmente, neuro-evolução é um dos...

Full description

Bibliographic Details
Main Author:	Côrtes, Deise da Silva
Other Authors:	Alvares, Luis Otavio Campos
Format:	Others
Language:	Portuguese
Published:	2007
Subjects:	Inteligência artificial Agentes inteligentes Redes neurais
Online Access:	http://hdl.handle.net/10183/4404

id	ndltd-IBICT-oai-lume.ufrgs.br-10183-4404
record_format	oai_dc
spelling	ndltd-IBICT-oai-lume.ufrgs.br-10183-44042018-10-21T16:47:34Z Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos Côrtes, Deise da Silva Alvares, Luis Otavio Campos Inteligência artificial Agentes inteligentes Redes neurais Em ambientes dinâmicos e complexos, a política ótima de coordenação não pode ser derivada analiticamente, mas, deve ser aprendida através da interação direta com o ambiente. Geralmente, utiliza-se aprendizado por reforço para prover coordenação em tais ambientes. Atualmente, neuro-evolução é um dos métodos de aprendizado por reforço mais proeminentes. Em vista disto, neste trabalho, é proposto um modelo de coordenação baseado em neuro-evolução. Mais detalhadamente, desenvolveu-se uma extensão do método neuro-evolutivo conhecido como Enforced Subpopulations (ESP). Na extensão desenvolvida, a rede neural que define o comportamento de cada agente é totalmente conectada. Adicionalmente, é permitido que o algoritmo encontre, em tempo de treinamento, a quantidade de neurônios que deve estar presente na camada oculta da rede neural de cada agente. Esta alteração, além de oferecer flexibilidade na definição da topologia da rede de cada agente e diminuir o tempo necessário para treinamento, permite também a constituição de grupos de agentes heterogêneos. Um ambiente de simulação foi desenvolvido e uma série de experimentos realizados com o objetivo de avaliar o modelo proposto e identificar quais os melhores valores para os diversos parâmetros do modelo. O modelo proposto foi aplicado no domínio das tarefas de perseguição-evasão. 2007-06-06T17:35:58Z 2005 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10183/4404 000501085 por info:eu-repo/semantics/openAccess application/pdf reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul instacron:UFRGS
collection	NDLTD
language	Portuguese
format	Others
sources	NDLTD
topic	Inteligência artificial Agentes inteligentes Redes neurais
spellingShingle	Inteligência artificial Agentes inteligentes Redes neurais Côrtes, Deise da Silva Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
description	Em ambientes dinâmicos e complexos, a política ótima de coordenação não pode ser derivada analiticamente, mas, deve ser aprendida através da interação direta com o ambiente. Geralmente, utiliza-se aprendizado por reforço para prover coordenação em tais ambientes. Atualmente, neuro-evolução é um dos métodos de aprendizado por reforço mais proeminentes. Em vista disto, neste trabalho, é proposto um modelo de coordenação baseado em neuro-evolução. Mais detalhadamente, desenvolveu-se uma extensão do método neuro-evolutivo conhecido como Enforced Subpopulations (ESP). Na extensão desenvolvida, a rede neural que define o comportamento de cada agente é totalmente conectada. Adicionalmente, é permitido que o algoritmo encontre, em tempo de treinamento, a quantidade de neurônios que deve estar presente na camada oculta da rede neural de cada agente. Esta alteração, além de oferecer flexibilidade na definição da topologia da rede de cada agente e diminuir o tempo necessário para treinamento, permite também a constituição de grupos de agentes heterogêneos. Um ambiente de simulação foi desenvolvido e uma série de experimentos realizados com o objetivo de avaliar o modelo proposto e identificar quais os melhores valores para os diversos parâmetros do modelo. O modelo proposto foi aplicado no domínio das tarefas de perseguição-evasão.
author2	Alvares, Luis Otavio Campos
author_facet	Alvares, Luis Otavio Campos Côrtes, Deise da Silva
author	Côrtes, Deise da Silva
author_sort	Côrtes, Deise da Silva
title	Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_short	Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_full	Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_fullStr	Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_full_unstemmed	Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
title_sort	modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos
publishDate	2007
url	http://hdl.handle.net/10183/4404
work_keys_str_mv	AT cortesdeisedasilva modeloneuroevolutivodecoordenacaoadaptativaemambientesdinamicos
_version_	1718775730002722816

Modelo neuro-evolutivo de coordenação adaptativa em ambientes dinâmicos

Similar Items