Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition

Cette thèse est consacrée au problème de la reconnaissance visuelle des objets basé sur l'ordinateur, qui est devenue un sujet de recherche très populaire et important ces dernières années grâce à ses nombreuses applications comme l'indexation et la recherche d'image et de vidéo , le...

Full description

Bibliographic Details
Main Author: Zhu, Chao
Language:ENG
Published: Ecole Centrale de Lyon 2012
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00755644
http://tel.archives-ouvertes.fr/docs/00/75/56/44/PDF/TH_T2264_czhu.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00755644
record_format oai_dc
collection NDLTD
language ENG
sources NDLTD
topic [SPI:OTHER] Engineering Sciences/Other
[SPI:OTHER] Sciences de l'ingénieur/Autre
Description visuelle
Extraction de caractéristiques
Reconnaissance des objets
Classification de scène
SIFT
DAISY
Gradients du second ordre
Local binaire patterns (LBP)
CS-LBP
OC-LBP
spellingShingle [SPI:OTHER] Engineering Sciences/Other
[SPI:OTHER] Sciences de l'ingénieur/Autre
Description visuelle
Extraction de caractéristiques
Reconnaissance des objets
Classification de scène
SIFT
DAISY
Gradients du second ordre
Local binaire patterns (LBP)
CS-LBP
OC-LBP
Zhu, Chao
Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
description Cette thèse est consacrée au problème de la reconnaissance visuelle des objets basé sur l'ordinateur, qui est devenue un sujet de recherche très populaire et important ces dernières années grâce à ses nombreuses applications comme l'indexation et la recherche d'image et de vidéo , le contrôle d'accès de sécurité, la surveillance vidéo, etc. Malgré beaucoup d'efforts et de progrès qui ont été fait pendant les dernières années, il reste un problème ouvert et est encore considéré comme l'un des problèmes les plus difficiles dans la communauté de vision par ordinateur, principalement en raison des similarités entre les classes et des variations intra-classe comme occlusion, clutter de fond, les changements de point de vue, pose, l'échelle et l'éclairage. Les approches populaires d'aujourd'hui pour la reconnaissance des objets sont basé sur les descripteurs et les classiffieurs, ce qui généralement extrait des descripteurs visuelles dans les images et les vidéos d'abord, et puis effectue la classification en utilisant des algorithmes d'apprentissage automatique sur la base des caractéristiques extraites. Ainsi, il est important de concevoir une bonne description visuelle, qui devrait être à la fois discriminatoire et efficace à calcul, tout en possédant certaines propriétés de robustesse contre les variations mentionnées précédemment. Dans ce contexte, l'objectif de cette thèse est de proposer des contributions novatrices pour la tâche de la reconnaissance visuelle des objets, en particulier de présenter plusieurs nouveaux descripteurs visuelles qui représentent effectivement et efficacement le contenu visuel d'image et de vidéo pour la reconnaissance des objets. Les descripteurs proposés ont l'intention de capturer l'information visuelle sous aspects différents. Tout d'abord, nous proposons six caractéristiques LBP couleurs de multi-échelle pour traiter les défauts principaux du LBP original, c'est-à-dire, le déffcit d'information de couleur et la sensibilité aux variations des conditions d'éclairage non-monotoniques. En étendant le LBP original à la forme de multi-échelle dans les différents espaces de couleur, les caractéristiques proposées non seulement ont plus de puissance discriminante par l'obtention de plus d'information locale, mais possèdent également certaines propriétés d'invariance aux différentes variations des conditions d'éclairage. En plus, leurs performances sont encore améliorées en appliquant une stratégie de l'image division grossière à fine pour calculer les caractéristiques proposées dans les blocs d'image afin de coder l'information spatiale des structures de texture. Les caractéristiques proposées capturent la distribution mondiale de l'information de texture dans les images. Deuxièmement, nous proposons une nouvelle méthode pour réduire la dimensionnalité du LBP appelée la combinaison orthogonale de LBP (OC-LBP). Elle est adoptée pour construire un nouveau descripteur local basé sur la distribution en suivant une manière similaire à SIFT. Notre objectif est de construire un descripteur local plus efficace en remplaçant l'information de gradient coûteux par des patterns de texture locales dans le régime du SIFT. Comme l'extension de notre première contribution, nous étendons également le descripteur OC-LBP aux différents espaces de couleur et proposons six descripteurs OC-LBP couleurs pour améliorer la puissance discriminante et la propriété d'invariance photométrique du descripteur basé sur l'intensité. Les descripteurs proposés capturent la distribution locale de l'information de texture dans les images. Troisièmement, nous introduisons DAISY, un nouveau descripteur local rapide basé sur la distribution de gradient, dans le domaine de la reconnaissance visuelle des objets. [...]
author Zhu, Chao
author_facet Zhu, Chao
author_sort Zhu, Chao
title Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
title_short Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
title_full Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
title_fullStr Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
title_full_unstemmed Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
title_sort effective and efficient visual description based on local binary patterns and gradient distribution for object recognition
publisher Ecole Centrale de Lyon
publishDate 2012
url http://tel.archives-ouvertes.fr/tel-00755644
http://tel.archives-ouvertes.fr/docs/00/75/56/44/PDF/TH_T2264_czhu.pdf
work_keys_str_mv AT zhuchao effectiveandefficientvisualdescriptionbasedonlocalbinarypatternsandgradientdistributionforobjectrecognition
_version_ 1716615918507786240
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-007556442013-12-03T03:20:54Z http://tel.archives-ouvertes.fr/tel-00755644 2012ECDL0005 http://tel.archives-ouvertes.fr/docs/00/75/56/44/PDF/TH_T2264_czhu.pdf Effective and efficient visual description based on local binary patterns and gradient distribution for object recognition Zhu, Chao [SPI:OTHER] Engineering Sciences/Other [SPI:OTHER] Sciences de l'ingénieur/Autre Description visuelle Extraction de caractéristiques Reconnaissance des objets Classification de scène SIFT DAISY Gradients du second ordre Local binaire patterns (LBP) CS-LBP OC-LBP Cette thèse est consacrée au problème de la reconnaissance visuelle des objets basé sur l'ordinateur, qui est devenue un sujet de recherche très populaire et important ces dernières années grâce à ses nombreuses applications comme l'indexation et la recherche d'image et de vidéo , le contrôle d'accès de sécurité, la surveillance vidéo, etc. Malgré beaucoup d'efforts et de progrès qui ont été fait pendant les dernières années, il reste un problème ouvert et est encore considéré comme l'un des problèmes les plus difficiles dans la communauté de vision par ordinateur, principalement en raison des similarités entre les classes et des variations intra-classe comme occlusion, clutter de fond, les changements de point de vue, pose, l'échelle et l'éclairage. Les approches populaires d'aujourd'hui pour la reconnaissance des objets sont basé sur les descripteurs et les classiffieurs, ce qui généralement extrait des descripteurs visuelles dans les images et les vidéos d'abord, et puis effectue la classification en utilisant des algorithmes d'apprentissage automatique sur la base des caractéristiques extraites. Ainsi, il est important de concevoir une bonne description visuelle, qui devrait être à la fois discriminatoire et efficace à calcul, tout en possédant certaines propriétés de robustesse contre les variations mentionnées précédemment. Dans ce contexte, l'objectif de cette thèse est de proposer des contributions novatrices pour la tâche de la reconnaissance visuelle des objets, en particulier de présenter plusieurs nouveaux descripteurs visuelles qui représentent effectivement et efficacement le contenu visuel d'image et de vidéo pour la reconnaissance des objets. Les descripteurs proposés ont l'intention de capturer l'information visuelle sous aspects différents. Tout d'abord, nous proposons six caractéristiques LBP couleurs de multi-échelle pour traiter les défauts principaux du LBP original, c'est-à-dire, le déffcit d'information de couleur et la sensibilité aux variations des conditions d'éclairage non-monotoniques. En étendant le LBP original à la forme de multi-échelle dans les différents espaces de couleur, les caractéristiques proposées non seulement ont plus de puissance discriminante par l'obtention de plus d'information locale, mais possèdent également certaines propriétés d'invariance aux différentes variations des conditions d'éclairage. En plus, leurs performances sont encore améliorées en appliquant une stratégie de l'image division grossière à fine pour calculer les caractéristiques proposées dans les blocs d'image afin de coder l'information spatiale des structures de texture. Les caractéristiques proposées capturent la distribution mondiale de l'information de texture dans les images. Deuxièmement, nous proposons une nouvelle méthode pour réduire la dimensionnalité du LBP appelée la combinaison orthogonale de LBP (OC-LBP). Elle est adoptée pour construire un nouveau descripteur local basé sur la distribution en suivant une manière similaire à SIFT. Notre objectif est de construire un descripteur local plus efficace en remplaçant l'information de gradient coûteux par des patterns de texture locales dans le régime du SIFT. Comme l'extension de notre première contribution, nous étendons également le descripteur OC-LBP aux différents espaces de couleur et proposons six descripteurs OC-LBP couleurs pour améliorer la puissance discriminante et la propriété d'invariance photométrique du descripteur basé sur l'intensité. Les descripteurs proposés capturent la distribution locale de l'information de texture dans les images. Troisièmement, nous introduisons DAISY, un nouveau descripteur local rapide basé sur la distribution de gradient, dans le domaine de la reconnaissance visuelle des objets. [...] 2012-04-03 ENG PhD thesis Ecole Centrale de Lyon