Exploration-exploitation with Thompson sampling in linear systems

Cette thèse est dédiée à l'étude du Thompson Sampling (TS), une heuristique qui vise à surmonter le dilemme entre exploration et exploitation qui est inhérent à tout processus décisionnel face à l'incertain. Contrairement aux algorithmes issus de l'heuristique optimiste face à l'...

Full description

Bibliographic Details
Main Author: Abeille, Marc
Other Authors: Lille 1
Language:en
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017LIL10182/document