Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)

Ce document présente mon ``projet de recherche'' sur le thème de l'embodiment (``cognition incarnée'') au croisement des sciences cognitives, de l'intelligence artificielle et de la robotique. Plus précisément, je montre comment je compte explorer la façon dont un agent...

Full description

Bibliographic Details
Main Author: Dutech, Alain
Language:FRE
Published: Université Nancy II 2010
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00549108
http://tel.archives-ouvertes.fr/docs/00/54/91/08/PDF/dutech_hdr_2010.pdf
http://tel.archives-ouvertes.fr/docs/00/54/91/08/ANNEX/dutech_hdr_annexes_2010.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00549108
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-005491082013-01-07T17:49:24Z http://tel.archives-ouvertes.fr/tel-00549108 http://tel.archives-ouvertes.fr/docs/00/54/91/08/PDF/dutech_hdr_2010.pdf http://tel.archives-ouvertes.fr/docs/00/54/91/08/ANNEX/dutech_hdr_annexes_2010.pdf Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée) Dutech, Alain [INFO:INFO_OH] Computer Science/Other [SPI:AUTO] Engineering Sciences/Automatic Sciences Cognitives Intelligence Artificielle Robotique Apprentissage par Renforcement Représentations Environnements non-Markoviens POMDP Ce document présente mon ``projet de recherche'' sur le thème de l'embodiment (``cognition incarnée'') au croisement des sciences cognitives, de l'intelligence artificielle et de la robotique. Plus précisément, je montre comment je compte explorer la façon dont un agent, artificiel ou biologique, élabore des représentations utiles et pertinentes de son environnement. Dans un premier temps, je positionne mes travaux en explicitant notamment les concepts de l'embodiment et de l'apprentissage par renforcement. Je m'attarde notamment sur la problématique de l'apprentissage par renforcement pour des tâches non-Markoviennes qui est une problématique commune aux différents travaux de recherche que j'ai menés au cours des treize dernières années dans des contextes mono et multi-agents, mais aussi robotique. L'analyse de ces travaux et de l'état de l'art du domaine me conforte dans l'idée que la principale difficulté pour l'agent est bien celle de trouver des représentations adaptées, utiles et pertinentes. J'argumente que l'on se retrouve face à une problématique fondamentale de la cognition, intimement liée aux problèmes de ``l'ancrage des symboles'', du ``frame problem'' et du fait ``d'être en situation'' et qu'on ne pourra y apporter des réponses que dans le cadre de l'embodiment. C'est à partir de ce constat que, dans une dernière partie, j'aborde les axes et les approches que je vais suivre pour poursuivre mes travaux en développant des techniques d'apprentissage robotique qui soient incrémentales, holistiques et motivationnelles. 2010-12-02 FRE habilitation ࠤiriger des recherches Université Nancy II
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_OH] Computer Science/Other
[SPI:AUTO] Engineering Sciences/Automatic
Sciences Cognitives
Intelligence Artificielle
Robotique
Apprentissage par Renforcement
Représentations
Environnements non-Markoviens
POMDP
spellingShingle [INFO:INFO_OH] Computer Science/Other
[SPI:AUTO] Engineering Sciences/Automatic
Sciences Cognitives
Intelligence Artificielle
Robotique
Apprentissage par Renforcement
Représentations
Environnements non-Markoviens
POMDP
Dutech, Alain
Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)
description Ce document présente mon ``projet de recherche'' sur le thème de l'embodiment (``cognition incarnée'') au croisement des sciences cognitives, de l'intelligence artificielle et de la robotique. Plus précisément, je montre comment je compte explorer la façon dont un agent, artificiel ou biologique, élabore des représentations utiles et pertinentes de son environnement. Dans un premier temps, je positionne mes travaux en explicitant notamment les concepts de l'embodiment et de l'apprentissage par renforcement. Je m'attarde notamment sur la problématique de l'apprentissage par renforcement pour des tâches non-Markoviennes qui est une problématique commune aux différents travaux de recherche que j'ai menés au cours des treize dernières années dans des contextes mono et multi-agents, mais aussi robotique. L'analyse de ces travaux et de l'état de l'art du domaine me conforte dans l'idée que la principale difficulté pour l'agent est bien celle de trouver des représentations adaptées, utiles et pertinentes. J'argumente que l'on se retrouve face à une problématique fondamentale de la cognition, intimement liée aux problèmes de ``l'ancrage des symboles'', du ``frame problem'' et du fait ``d'être en situation'' et qu'on ne pourra y apporter des réponses que dans le cadre de l'embodiment. C'est à partir de ce constat que, dans une dernière partie, j'aborde les axes et les approches que je vais suivre pour poursuivre mes travaux en développant des techniques d'apprentissage robotique qui soient incrémentales, holistiques et motivationnelles.
author Dutech, Alain
author_facet Dutech, Alain
author_sort Dutech, Alain
title Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)
title_short Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)
title_full Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)
title_fullStr Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)
title_full_unstemmed Apprentissage par Renforcement : Au delà des Processus Décisionnels de Markov (Vers la cognition incarnée)
title_sort apprentissage par renforcement : au delà des processus décisionnels de markov (vers la cognition incarnée)
publisher Université Nancy II
publishDate 2010
url http://tel.archives-ouvertes.fr/tel-00549108
http://tel.archives-ouvertes.fr/docs/00/54/91/08/PDF/dutech_hdr_2010.pdf
http://tel.archives-ouvertes.fr/docs/00/54/91/08/ANNEX/dutech_hdr_annexes_2010.pdf
work_keys_str_mv AT dutechalain apprentissageparrenforcementaudeladesprocessusdecisionnelsdemarkovverslacognitionincarnee
_version_ 1716397065821487104