Regret minimisation and system-efficiency in route choice

Aprendizagem por reforço multiagente (do inglês, MARL) é uma tarefa desafiadora em que agentes buscam, concorrentemente, uma política capaz de maximizar sua utilidade. Aprender neste tipo de cenário é difícil porque os agentes devem se adaptar uns aos outros, tornando o objetivo um alvo em movimento...

Full description

Bibliographic Details
Main Author: Ramos, Gabriel de Oliveira
Other Authors: Bazzan, Ana Lucia Cetertich
Format: Others
Language:English
Published: 2018
Subjects:
Online Access:http://hdl.handle.net/10183/178665