Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda

Planejamento Probabilístico estuda os problemas de tomada de decisão sequencial de um agente, em que as ações possuem efeitos probabilísticos, modelados como um processo de decisão markoviano (Markov Decision Process - MDP). Dadas a função de transição de estados probabilística e os valores de recom...

Full description

Bibliographic Details
Main Author:	Lacerda, Dênis Antonio
Other Authors:	Barros, Leliane Nunes de
Format:	Others
Language:	pt
Published:	Biblioteca Digitais de Teses e Dissertações da USP 2013
Subjects:	Aprendizado de processos de venda Aprendizado por reforço em lote Batch reinforcement learning Markov decision process Planejamento probabilístico Probabilistic planning Processo de decisão markoviano Sales process learning
Online Access:	http://www.teses.usp.br/teses/disponiveis/45/45134/tde-03072014-101251/

Internet

http://www.teses.usp.br/teses/disponiveis/45/45134/tde-03072014-101251/

Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda

Internet

Similar Items