Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda
Planejamento Probabilístico estuda os problemas de tomada de decisão sequencial de um agente, em que as ações possuem efeitos probabilísticos, modelados como um processo de decisão markoviano (Markov Decision Process - MDP). Dadas a função de transição de estados probabilística e os valores de recom...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | pt |
Published: |
Biblioteca Digitais de Teses e Dissertações da USP
2013
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/45/45134/tde-03072014-101251/ |