Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma
Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da vari...
Main Authors: | , , , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universidade de Passo Fundo (UPF)
2016-09-01
|
Series: | Revista Brasileira de Computação Aplicada |
Subjects: | |
Online Access: | http://seer.upf.br/index.php/rbca/article/view/5249 |