• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
10.11606/T.45.2013.tde-29042013-111855
Document
Author
Full name
Arnaldo Câmara Lara
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2013
Supervisor
Committee
Hirata Junior, Roberto (President)
Hashimoto, Ronaldo Fumio
Kim, Hae Yong
Morimoto, Carlos Hitoshi
Valle Junior, Eduardo Alves do
Title in Portuguese
Descritor de bordas e quantização espacial flexível aplicados a categorização de objetos
Keywords in Portuguese
categorização de objetos
granulometria
quantização espacial
Abstract in Portuguese
A área de reconhecimento de objetos tem assistido a um impressionante progresso na última década. O estudo de descritores, aliado à estratégias de amostragem usando quantizações espaciais e a combinação de classificadores têm permeado o estado da arte nos últimos anos. Neste trabalho é proposta uma nova quantização espacial com número arbitrário de níveis e subdivisões arbitrárias de regiões. Regiões adjacentes possuem sobreposição gerando redundância na representação destas regiões de fronteiras e, assim, evitando as quebras que acontecem nas pirâmides espaciais tradicionais que prejudicam a interpretação das formas. Apesar de melhorar o desempenho da abordagem do saco de palavras, as pirâmides espaciais não são robustas a variações na orientação dos objetos na imagem. Foi também proposto neste trabalho, uma divisão espacial utilizando regiões circulares concêntricas que aumentam a robustez a rotação dos objetos na imagem em aproximadamente 80% quando comparada às pirâmides espaciais. Além das novas divisões espaciais, é proposto neste trabalho um novo descritor baseado na aplicação de granulometria morfológica no mapa de bordas da imagem original. Este descritor foi utilizado na criação de modelos de classes em aplicações de categorização de objetos utilizando uma base de dados pública com resultados superiores aos do melhor descritor baseado em bordas reportado pela literatura. Todas estas novas técnicas propostas foram utilizadas em um problema desafiador de categorização de objetos de classes muito parecidas. Foi utilizado um subconjunto da base de pássaros Caltech-UCSD Birds-200 2011 com resultados comparáveis aos melhores resultados reportados pela literatura. A abordagem proposta cria uma classificação de dois níveis e utiliza modelos específicos por classe o que é intuitivo, pois cada espécie de pássaro possui características muito sutis que as diferenciam das demais espécies testadas. Vários descritores são utilizados na criação dos modelos de classes e uma combinação de classificadores gera a rotulação final para a amostra. O descritor proposto neste trabalho esteve presente no melhor modelo de 11 das 13 classes testadas e o resultado final obtido pela técnica de categorização proposta é o melhor resultado utilizando a abordagem do saco de palavras.
Title in English
Edge-based descriptor and flexible spatial quantization applied to object categorization.
Keywords in English
granulometry
object categorization
spatial quantization
Abstract in English
The object recognition area has experienced an impressive progress in the last decade. The study of descriptors, together with a sampling strategy using spatial quantization and the combination of classifiers have been presented in the state of art in recent years. This work proposes a new spatial quantizations with an arbitrary number of levels and divisions in each level. Adjacent regions have overlapping areas that generate redundant representation and avoid breakages in the structures that are in their border regions as it happens in the traditional spatial pyramids and impairs the correct interpretation of these structures. Despite spatial pyramids to improve the performance of the bag-of-words approach in object recognition, they are not robust to changes in object orientation in the image. It was also proposed, in this work, a spatial division using concentric circular regions that is almost 80% more robust to rotation of objects when compared to the spatial pyramids using rectangular divisions. In addition to the new spatial division of the image, it is proposed a new granulometric-based descriptor that it is applied to the map of edges of the original image. This descriptor was used in the building of categorys models for object categorization in a public database and showed a better performance than the most used edge-based descriptor reported in literature. All these new proposed techniques were used in a challenge problem of object categorization of very similar classes. It was used a subset of the public database Caltech-UCSD Birds-200 2011 and the method obtained results compared to the best results reported in the literature. The proposed approach uses a 2-level classification and builds class-specific models that are an intuitive way to model the species of birds as very subtle characteristics differ in each tested class of birds. Many descriptors are used in the building of models of species and a combination of classifiers generates the final label for a tested sample. The descriptor proposed here were presented in 11 of 13 best models of birds classes. The final result obtained by the proposed object categorization method is the best one using the bag-of-words approach.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
tese.pdf (24.78 Mbytes)
Publishing Date
2013-04-30
 
WARNING: The material described below relates to works resulting from this thesis or dissertation. The contents of these works are the author's responsibility.
  • Lara, Arnaldo C., and Hirata Jr., Roberto. A Granulometry Based Descriptor For Object Categorization. In 11th International Symposium on Mathematical Morphology, Uppsala, 2013. Proceedings of the 11th International Symposium on Mathematical Morphology., 2013.
  • Lara, Arnaldo C., and Hirata Jr., Roberto. A Pyramid of Concentric Circular Regions to Improve Rotation Invariance in Bag-of-Words Approach for Object Categorization. In 8th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications, Barcelona, 2013. 8th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications. : Springer-Verlag, 2013.
  • Lara, Arnaldo C., and Hirata Jr., Roberto. Combining features to a class-specific model in an instance detection framework. In XXIV Sibgrapi Conference on Graphics, Patterns and Images, Maceió, 2011. XXIV Sibgrapi Conference on Graphics, Patterns and Images. : IEEE, 2011.
All rights of the thesis/dissertation are from the authors
Centro de Informática de São Carlos
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2020. All rights reserved.