Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional

Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem...

Full description

Bibliographic Details
Main Authors: André Luiz Carvalho Ottoni, Erivelton Geraldo Nepomuceno, Marcos Santos de Oliveira
Format: Article
Language:English
Published: Universidade de Passo Fundo (UPF) 2017-10-01
Series:Revista Brasileira de Computação Aplicada
Subjects:
Online Access:http://seer.upf.br/index.php/rbca/article/view/6601
id doaj-da14d9f41cf64f5f9af31a69faa7b9ef
record_format Article
spelling doaj-da14d9f41cf64f5f9af31a69faa7b9ef2020-11-24T21:12:52ZengUniversidade de Passo Fundo (UPF)Revista Brasileira de Computação Aplicada2176-66492017-10-0193567010.5335/rbca.v9i3.66014531Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensionalAndré Luiz Carvalho Ottoni0Erivelton Geraldo Nepomuceno1Marcos Santos de Oliveira2CEFET-MGUniversidade Federal de São João del-ReiUniversidade Federal de São João del-ReiNeste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.http://seer.upf.br/index.php/rbca/article/view/6601Aprendizado por ReforçoOtimização CombinatóriaProblema da Mochila Multidimensional
collection DOAJ
language English
format Article
sources DOAJ
author André Luiz Carvalho Ottoni
Erivelton Geraldo Nepomuceno
Marcos Santos de Oliveira
spellingShingle André Luiz Carvalho Ottoni
Erivelton Geraldo Nepomuceno
Marcos Santos de Oliveira
Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
Revista Brasileira de Computação Aplicada
Aprendizado por Reforço
Otimização Combinatória
Problema da Mochila Multidimensional
author_facet André Luiz Carvalho Ottoni
Erivelton Geraldo Nepomuceno
Marcos Santos de Oliveira
author_sort André Luiz Carvalho Ottoni
title Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
title_short Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
title_full Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
title_fullStr Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
title_full_unstemmed Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
title_sort análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
publisher Universidade de Passo Fundo (UPF)
series Revista Brasileira de Computação Aplicada
issn 2176-6649
publishDate 2017-10-01
description Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.
topic Aprendizado por Reforço
Otimização Combinatória
Problema da Mochila Multidimensional
url http://seer.upf.br/index.php/rbca/article/view/6601
work_keys_str_mv AT andreluizcarvalhoottoni analisedodesempenhodoaprendizadoporreforconasolucaodoproblemadamochilamultidimensional
AT eriveltongeraldonepomuceno analisedodesempenhodoaprendizadoporreforconasolucaodoproblemadamochilamultidimensional
AT marcossantosdeoliveira analisedodesempenhodoaprendizadoporreforconasolucaodoproblemadamochilamultidimensional
_version_ 1716749744121839616