Sparse Spatial Coding: a novel approach for efficient and accurate object recognition

=== Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse sp...

Full description

Bibliographic Details
Main Author: Gabriel Leivas Oliveira
Other Authors: Mario Fernando Montenegro Campos
Format: Others
Language:English
Published: Universidade Federal de Minas Gerais 2012
Online Access:http://hdl.handle.net/1843/ESBF-8SVMLB
Description
Summary:=== Successful state-of-the-art object recognition techniques from images have been based on powerful techniques, such as sparse representation, in order to replace the also popular vector quantization approach. Recently, sparse coding, which is characterized by representing a signal in a sparse space, has raised the bar on sev-eral object recognition benchmarks. However, one serious drawback of sparse space based methods is that similar local features can be quantized into different visual words. We present in this thesis a new object recognition approach, called Sparse Spa-tial Coding (SSC), which combines a sparse coding dictionary learning and a spatial constraint coding stage. Thus, we minimize the problems of pure sparse represen-tations. Experimental evaluation was done at Caltech 101, Caltech 256, Corel 5000 and Corel 10000, that are datasets specifically designed to object recognition evalu-ation. The obtained results show that, to the best of our knowledge, our approach achieves accuracy beyond the best single feature method previously published on the databases. The method also outperformed, for the same bases, several methods that use multiple feature, and provide equivalent to or slightly lower results than other techniques. Finally, we verify our method generalization, applying the SSC to recognize scene in the Indoor 67 scene dataset, VPC and COLD, displaying perfor-mance comparable to state-of-the-art approaches in the first two bases and superior in COLD dataset. === Até recentemente o reconhecimento de objetos, um problema clássicodaVisãoCom-putacional, vinha sendo abordado por técnicas baseadas em quantização vetorial. Entretanto, atualmente, abordagens que utilizam representação esparsa tem ap-resentado resultados significativamente superiores às técnicas usuais. Entretanto, uma desvantagem de métodos baseados em representação esparsa é o fato de car-acterísticas similares poderem ser quantizadas por conjuntos diferentes de palavras visuais. Esta dissertação apresenta um novo método de reconhecimento de objetos de-nominado SSC Sparse Spatial Coding o qual é caracterizado pelo aprendizado do dicionário utilizando representação esparsa e codificação baseada em restrição es-pacial. Dessa forma, minimiza-se significativamente o problema típico encontrado em representações estritamente esparsas. A avaliação do SSC foi realizada por meio de experimentos aplicando-o às bases Caltech 101, Caltech 256, Corel 5000 e Corel 10000, criadas especificamente para avaliação de técnicas de reconhecimento de objetos. Os resultados obtidos demonstram desempenho superior aos reportados na literatura até o momento para os métodos que utilizam um único descritor. O método também superou, para as mesmas bases, vários outros métodos que utilizam múltiplas características, e apre-sentou desempenho equivalente ou apenas ligeiramente inferior a outras técnicas. Finalmente, para verificarmos a generalização, o SSC foi utilizado para o reconheci-mento de cenas nas bases Indoor 67, VPC e COLD tendo apresentado desempenho comparável ao de abordagens do estado da arte para as duas primeiras bases e su-perior na base COLD.