Elicitation and planning in Markov decision processes with unknown rewards

Les processus décisionnels de Markov (MDPs) modélisent des problèmes de décisionsséquentielles dans lesquels un utilisateur interagit avec l’environnement et adapte soncomportement en prenant en compte les signaux de récompense numérique reçus. La solutiond’unMDP se ramène à formuler le comportement...

Full description

Bibliographic Details
Main Author:	Alizadeh, Pegah
Other Authors:	Sorbonne Paris Cité
Language:	en
Published:	2016
Subjects:	Processus décisionnel de Markov Valeur vectorielle MDP Markov decision process Vector-valued MPD Policy iteration Reward elicitation
Online Access:	http://www.theses.fr/2016USPCD011/document

Internet

http://www.theses.fr/2016USPCD011/document

Elicitation and planning in Markov decision processes with unknown rewards

Internet

Similar Items