L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole
Dans cette thèse, nous proposons d'utiliser des techniques fondées sur l'analyse factorielle pour la modélisation acoustique pour le traitement automatique de la parole, notamment pour la Reconnaissance Automatique de la parole. Nous nous sommes, dans un premier temps, intéressés à la rédu...
Main Author: | |
---|---|
Language: | fra |
Published: |
Université d'Avignon
2013
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-01059020 http://tel.archives-ouvertes.fr/docs/01/05/90/20/PDF/pdf2star-1397650195-Th--se_Bouallegue_Mohamed.pdf |
id |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-01059020 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-010590202014-09-11T03:26:40Z http://tel.archives-ouvertes.fr/tel-01059020 2013AVIG0197 http://tel.archives-ouvertes.fr/docs/01/05/90/20/PDF/pdf2star-1397650195-Th--se_Bouallegue_Mohamed.pdf L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole Bouallegue, Mohamed [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Reconnaissance automatique de la parole Analyse factorielle Modélisation acoustique compacte Classification phonétique Variabilité acoustique Dans cette thèse, nous proposons d'utiliser des techniques fondées sur l'analyse factorielle pour la modélisation acoustique pour le traitement automatique de la parole, notamment pour la Reconnaissance Automatique de la parole. Nous nous sommes, dans un premier temps, intéressés à la réduction de l'empreinte mémoire des modèles acoustiques. Notre méthode à base d'analyse factorielle a démontré une capacité de mutualisation des paramètres des modèles acoustiques, tout en maintenant des performances similaires à celles des modèles de base. La modélisation proposée nous conduit à décomposer l'ensemble des paramètres des modèles acoustiques en sous-ensembles de paramètres indépendants, ce qui permet une grande flexibilité pour d'éventuelles adaptations (locuteurs, genre, nouvelles tâches).Dans les modélisations actuelles, un état d'un Modèle de Markov Caché (MMC) est représenté par un mélange de Gaussiennes (GMM : Gaussian Mixture Model). Nous proposons, comme alternative, une représentation vectorielle des états : les fac- teur d'états. Ces facteur d'états nous permettent de mesurer efficacement la similarité entre les états des MMC au moyen d'une distance euclidienne, par exemple. Grâce à cette représenation vectorielle, nous proposons une méthode simple et efficace pour la construction de modèles acoustiques avec des états partagés. Cette procédure s'avère encore plus efficace dans le cas de langues peu ou très peu dotées en ressouces et enconnaissances linguistiques. Enfin, nos efforts se sont portés sur la robustesse des systèmes de reconnaissance de la parole face aux variabilités acoustiques, et plus particulièrement celles générées par l'environnement. Nous nous sommes intéressés, dans nos différentes expérimentations, à la variabilité locuteur, à la variabilité canal et au bruit additif. Grâce à notre approche s'appuyant sur l'analyse factorielle, nous avons démontré la possibilité de modéliser ces différents types de variabilité acoustique nuisible comme une composante additive dans le domaine cepstral. Nous soustrayons cette composante des vecteurs cepstraux pour annuler son effet pénalisant pour la reconnaissance de la parole 2013-12-16 fra PhD thesis Université d'Avignon |
collection |
NDLTD |
language |
fra |
sources |
NDLTD |
topic |
[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Reconnaissance automatique de la parole Analyse factorielle Modélisation acoustique compacte Classification phonétique Variabilité acoustique |
spellingShingle |
[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Reconnaissance automatique de la parole Analyse factorielle Modélisation acoustique compacte Classification phonétique Variabilité acoustique Bouallegue, Mohamed L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
description |
Dans cette thèse, nous proposons d'utiliser des techniques fondées sur l'analyse factorielle pour la modélisation acoustique pour le traitement automatique de la parole, notamment pour la Reconnaissance Automatique de la parole. Nous nous sommes, dans un premier temps, intéressés à la réduction de l'empreinte mémoire des modèles acoustiques. Notre méthode à base d'analyse factorielle a démontré une capacité de mutualisation des paramètres des modèles acoustiques, tout en maintenant des performances similaires à celles des modèles de base. La modélisation proposée nous conduit à décomposer l'ensemble des paramètres des modèles acoustiques en sous-ensembles de paramètres indépendants, ce qui permet une grande flexibilité pour d'éventuelles adaptations (locuteurs, genre, nouvelles tâches).Dans les modélisations actuelles, un état d'un Modèle de Markov Caché (MMC) est représenté par un mélange de Gaussiennes (GMM : Gaussian Mixture Model). Nous proposons, comme alternative, une représentation vectorielle des états : les fac- teur d'états. Ces facteur d'états nous permettent de mesurer efficacement la similarité entre les états des MMC au moyen d'une distance euclidienne, par exemple. Grâce à cette représenation vectorielle, nous proposons une méthode simple et efficace pour la construction de modèles acoustiques avec des états partagés. Cette procédure s'avère encore plus efficace dans le cas de langues peu ou très peu dotées en ressouces et enconnaissances linguistiques. Enfin, nos efforts se sont portés sur la robustesse des systèmes de reconnaissance de la parole face aux variabilités acoustiques, et plus particulièrement celles générées par l'environnement. Nous nous sommes intéressés, dans nos différentes expérimentations, à la variabilité locuteur, à la variabilité canal et au bruit additif. Grâce à notre approche s'appuyant sur l'analyse factorielle, nous avons démontré la possibilité de modéliser ces différents types de variabilité acoustique nuisible comme une composante additive dans le domaine cepstral. Nous soustrayons cette composante des vecteurs cepstraux pour annuler son effet pénalisant pour la reconnaissance de la parole |
author |
Bouallegue, Mohamed |
author_facet |
Bouallegue, Mohamed |
author_sort |
Bouallegue, Mohamed |
title |
L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
title_short |
L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
title_full |
L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
title_fullStr |
L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
title_full_unstemmed |
L'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
title_sort |
l'analyse factorielle pour la modélisation acoustique des systèmes de reconnaissance de la parole |
publisher |
Université d'Avignon |
publishDate |
2013 |
url |
http://tel.archives-ouvertes.fr/tel-01059020 http://tel.archives-ouvertes.fr/docs/01/05/90/20/PDF/pdf2star-1397650195-Th--se_Bouallegue_Mohamed.pdf |
work_keys_str_mv |
AT boualleguemohamed lanalysefactoriellepourlamodelisationacoustiquedessystemesdereconnaissancedelaparole |
_version_ |
1716713766495715328 |