Aprendizado por reforço em lote: um estudo de caso para o problema de tomada de decisão em processos de venda

Planejamento Probabilístico estuda os problemas de tomada de decisão sequencial de um agente, em que as ações possuem efeitos probabilísticos, modelados como um processo de decisão markoviano (Markov Decision Process - MDP). Dadas a função de transição de estados probabilística e os valores de recom...

Full description

Bibliographic Details
Main Author: Lacerda, Dênis Antonio
Other Authors: Barros, Leliane Nunes de
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2013
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45134/tde-03072014-101251/