Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs

La classification est l'attribution d'une classe spécifique à un objet donné. Cette attribution a besoin d'un certain degré d'abstraction pour pouvoir extraire des généralités à partir des exemples dont on dispose. Pour une machine, la classification de visages, de données médica...

Full description

Bibliographic Details
Main Author:	Juan-Manuel, Torres-Moreno
Language:	FRE
Published:	1997
Subjects:	[INFO:INFO_HC] Computer Science/Human-Computer Interaction Apprentissage Classification Généralisation Méthodes constructives Perceptrons multicouches Réseaux de Neurones
Online Access:	http://tel.archives-ouvertes.fr/tel-00390069 http://tel.archives-ouvertes.fr/docs/00/39/00/69/PDF/these-jmtm.pdf http://tel.archives-ouvertes.fr/docs/00/39/00/69/ANNEX/these_torres_presentation.pdf

id	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00390069
record_format	oai_dc
spelling	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-003900692013-01-07T18:21:00Z http://tel.archives-ouvertes.fr/tel-00390069 http://tel.archives-ouvertes.fr/docs/00/39/00/69/PDF/these-jmtm.pdf http://tel.archives-ouvertes.fr/docs/00/39/00/69/ANNEX/these_torres_presentation.pdf Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs Juan-Manuel, Torres-Moreno [INFO:INFO_HC] Computer Science/Human-Computer Interaction Apprentissage Classification Généralisation Méthodes constructives Perceptrons multicouches Réseaux de Neurones La classification est l'attribution d'une classe spécifique à un objet donné. Cette attribution a besoin d'un certain degré d'abstraction pour pouvoir extraire des généralités à partir des exemples dont on dispose. Pour une machine, la classification de visages, de données médicales, de formes, sont toutes des tâches assez difficiles. Par exemple, dans le cas de la reconnaissance de caractères manuscrits, il est difficile d'énoncer une description générale qui tienne compte de toutes les variations particulières de chaque caractère. Une autre approche qui peut être utilisée pour cette tâche est celle de l'apprentissage. Ainsi, le critère pour décider si une image correspond ou non à une lettre 'A' consiste à comparer si cette image est (suffisamment similaire} à des 'a' vus auparavant. De ce point de vue, on ne calcule pas la classification de caractères : elle doit être apprise à partir d'exemples. Ces dernières années, de nouvelles techniques neuronales d'apprentissage ont été développées. Cet apprentissage avec des réseaux de neurones se fait actuellement en suivant deux approches : certains algorithmes comme la Rétropropagation du Gradient ont besoin d'introduire a priori le nombre et la connectivité des unités cachées et déterminer les poids des connexions par minimisation d'un coût. Le réseau ainsi obtenu est éventuellement élagué. Avec une approche constructive on apprend en même temps le nombre d'unités et les poids, dans le cadre d'une architecture fixée, commençant généralement avec une seule unité. Le but de cette thèse est de présenter de nouvelles heuristiques pour générer, d'une manière constructive, des réseaux de neurones pour la classification. Elles permettent de générer des réseaux à une seule couche cachée complètement connectée aux unités d'entrée, et un neurone de sortie connecté aux unités cachées. Les neurones cachés et de sortie sont des unités binaires, pouvant faire soit des séparations linéaires, soit des séparations sphériques. Ces heuristiques sont couplées avec des algorithmes d'apprentissage pour le perceptron, Minimerror-L pour les séparations linéaires et Minimerror-S pour les séparations sphériques. Trois nouveaux algorithmes constructifs, qui différent suivant le type de neurones cachés et aussi suivant la définition des cibles que ceux-ci doivent apprendre on été développés. Pendant le processus d'apprentissage, des neurones cachés entraînés pour apprendre ces cibles vont diminuer le nombre d'erreurs de classification du neurone de sortie. Les réseaux ainsi bâtis ont généralement moins de paramètres (poids) et généralisent mieux que les réseaux entraînés avec d'autres algorithmes. 1997-09-22 FRE PhD thesis
collection	NDLTD
language	FRE
sources	NDLTD
topic	[INFO:INFO_HC] Computer Science/Human-Computer Interaction Apprentissage Classification Généralisation Méthodes constructives Perceptrons multicouches Réseaux de Neurones
spellingShingle	[INFO:INFO_HC] Computer Science/Human-Computer Interaction Apprentissage Classification Généralisation Méthodes constructives Perceptrons multicouches Réseaux de Neurones Juan-Manuel, Torres-Moreno Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
description	La classification est l'attribution d'une classe spécifique à un objet donné. Cette attribution a besoin d'un certain degré d'abstraction pour pouvoir extraire des généralités à partir des exemples dont on dispose. Pour une machine, la classification de visages, de données médicales, de formes, sont toutes des tâches assez difficiles. Par exemple, dans le cas de la reconnaissance de caractères manuscrits, il est difficile d'énoncer une description générale qui tienne compte de toutes les variations particulières de chaque caractère. Une autre approche qui peut être utilisée pour cette tâche est celle de l'apprentissage. Ainsi, le critère pour décider si une image correspond ou non à une lettre 'A' consiste à comparer si cette image est (suffisamment similaire} à des 'a' vus auparavant. De ce point de vue, on ne calcule pas la classification de caractères : elle doit être apprise à partir d'exemples. Ces dernières années, de nouvelles techniques neuronales d'apprentissage ont été développées. Cet apprentissage avec des réseaux de neurones se fait actuellement en suivant deux approches : certains algorithmes comme la Rétropropagation du Gradient ont besoin d'introduire a priori le nombre et la connectivité des unités cachées et déterminer les poids des connexions par minimisation d'un coût. Le réseau ainsi obtenu est éventuellement élagué. Avec une approche constructive on apprend en même temps le nombre d'unités et les poids, dans le cadre d'une architecture fixée, commençant généralement avec une seule unité. Le but de cette thèse est de présenter de nouvelles heuristiques pour générer, d'une manière constructive, des réseaux de neurones pour la classification. Elles permettent de générer des réseaux à une seule couche cachée complètement connectée aux unités d'entrée, et un neurone de sortie connecté aux unités cachées. Les neurones cachés et de sortie sont des unités binaires, pouvant faire soit des séparations linéaires, soit des séparations sphériques. Ces heuristiques sont couplées avec des algorithmes d'apprentissage pour le perceptron, Minimerror-L pour les séparations linéaires et Minimerror-S pour les séparations sphériques. Trois nouveaux algorithmes constructifs, qui différent suivant le type de neurones cachés et aussi suivant la définition des cibles que ceux-ci doivent apprendre on été développés. Pendant le processus d'apprentissage, des neurones cachés entraînés pour apprendre ces cibles vont diminuer le nombre d'erreurs de classification du neurone de sortie. Les réseaux ainsi bâtis ont généralement moins de paramètres (poids) et généralisent mieux que les réseaux entraînés avec d'autres algorithmes.
author	Juan-Manuel, Torres-Moreno
author_facet	Juan-Manuel, Torres-Moreno
author_sort	Juan-Manuel, Torres-Moreno
title	Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
title_short	Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
title_full	Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
title_fullStr	Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
title_full_unstemmed	Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
title_sort	apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs
publishDate	1997
url	http://tel.archives-ouvertes.fr/tel-00390069 http://tel.archives-ouvertes.fr/docs/00/39/00/69/PDF/these-jmtm.pdf http://tel.archives-ouvertes.fr/docs/00/39/00/69/ANNEX/these_torres_presentation.pdf
work_keys_str_mv	AT juanmanueltorresmoreno apprentissageetgeneralisationpardesreseauxdeneuronesetudedenouveauxalgorithmesconstructifs
_version_	1716451939350216704

Apprentissage et généralisation par des réseaux de neurones : étude de nouveaux algorithmes constructifs

Similar Items