• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
10.11606/T.55.2012.tde-23072012-164717
Documento
Autor
Nome completo
Daniel dos Santos Kaster
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2012
Orientador
Banca examinadora
Traina Junior, Caetano (Presidente)
Fortes, Renata Pontin de Mattos
Heuser, Carlos Alberto
Lifschitz, Sergio
Medeiros, Claudia Maria Bauzer
Título em português
Tratamento de condições especiais para busca por similaridade em bancos de dados complexos
Palavras-chave em português
Banco de dados
Consultas por similaridade
Multimídia
Resumo em português
A quantidade de dados complexos (imagens, vídeos, séries temporais e outros) tem crescido rapidamente. Dados complexos são adequados para serem recuperados por similaridade, o que significa definir consultas de acordo com um dado critério de similaridade. Além disso, dados complexos usualmente são associados com outras informações, geralmente de tipos de dados convencionais, que devem ser utilizadas em conjunto com operações por similaridade para responder a consultas complexas. Vários trabalhos propuseram técnicas para busca por similaridade, entretanto, a maioria das abordagens não foi concebida para ser integrada com um SGBD, tratando consultas por similaridade como operações isoladas, disassociadas do processador de consultas. O objetivo principal desta tese é propor alternativas algébricas, estruturas de dados e algoritmos para permitir um uso abrangente de consultas por similaridade associadas às demais operações de busca disponibilizadas pelos SGBDs relacionais e executar essas consultas compostas eficientemente. Para alcançar este objetivo, este trabalho apresenta duas contribuições principais. A primeira contribuição é a proposta de uma nova operação por similaridade, chamada consulta aos k-vizinhos mais próximos estendida com condições (ck-NNq), que estende a consulta aos k-vizinhos mais próximos (k-'NN SUB. q') de maneira a fornecer uma condição adicional, modificando a semântica da operação. A operação proposta permite representar consultas demandadas por várias aplicações, que não eram capazes de ser representadas anteriormente, e permite homogeneamente integrar condições de filtragem complementares à k-'NN IND.q'. A segunda contribuição é o desenvolvimento do FMI-SiR (user-defined Features, Metrics and Indexes for Similarity Retrieval ), que é um módulo de banco de dados que permite executar consultas por similaridade integradas às demais operações do SGBD. O módulo permite incluir métodos de extração de características e funções de distância definidos pelo usuário no núcleo do gerenciador de banco de dados, fornecendo grande exibilidade, e também possui um tratamento especial para imagens médicas. Além disso, foi verificado através de experimentos sobre bancos de dados reais que a implementação do FMI-SiR sobre o SGBD Oracle é capaz de consultar eficientemente grandes bancos de dados complexos
Título em inglês
Treatment of special conditional for similarity searching in complex data bases
Palavras-chave em inglês
Multimedia databases
Similarity queries
Resumo em inglês
The amount of complex data (images, videos, time series and others) has been growing at a very fast pace. Complex data are well-suited to be searched by similarity, which means to define queries according to a given similarity criterion. Moreover, complex data are usually associated with other information, usually of conventional data types, which must be employed in conjunction with similarity operations to answer complex queries. Several works proposed techniques for similarity searching, however, the majority of the approaches was not conceived to be integrated into a DBMS, treating similarity queries as isolated operations detached from the query processor. The main objective of this thesis is to propose algebraic alternatives, data structures and algorithms to allow a wide use of similarity queries associated to the search operations provided by the relational DBMSs and to execute such composite queries eficiently. To reach this goal, this work presents two main contributions. The first contribution is the proposal of a new similarity operation, called condition-extended k-Nearest Neighbor query (ck-'NN IND. q'), that extends the k-Nearest Neighbor query (k-'NN IND. q') to provide an additional conditio modifying the operation semantics. The proposed operation allows representing queries required by several applications, which were not able to be represented before, and allows to homogeneously integrate complementary filtering conditions to the k-'NN IND. q'. The second contribution is the development of the FMI-SiR(user-defined Features, Metrics and Indexes for Similarity Retrieval), which is a database module that allows executing similarity queries integrated to the DBMS operations. The module allows including user-defined feature extraction methods and distance functions into the database core, providing great exibility, and also has a special treatment for medical images. Moreover, it was verified through experiments over real datasets that the implementation of FMI-SiR over the Oracle DBMS is able to eficiently search very large complex databases
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2012-07-24
 
AVISO: O material descrito abaixo refere-se a trabalhos decorrentes desta tese ou dissertação. O conteúdo desses trabalhos é de inteira responsabilidade do autor da tese ou dissertação.
  • Kaster, D., et al. FMI-SiR: A Flexible and Efficient Module for Similarity Searching on Oracle Database. Journal of Information and Data Management - JIDM [online], 2010, vol. 1, p. 229-244. Available from: http://seer.lcc.ufmg.br/index.php/jidm/article/view/37.
  • KASTER, D., et al. Nearest Neighbor Queries with Counting Aggregate-based Conditions. Journal of Information and Data Management - JIDM, 2011, vol. 2, p. 401-416.
  • KASTER, D., et al. MedFMI-SiR: A Powerful DBMS Solution for Large-scale Medical Image Retrieval [doi:10.1007/978-3-642-23208-4_2]. In 2nd International Conference on Information Technology in Bio- and Medical Informatics ( ITBAM '2011), Toulouse, 2011. Proc. of the ITBAM'2011.Berlin : Springer-Verlag, 2011.
  • Bueno, R., et al. Unsupervised Scaling of Multi-Descriptor Similarity Functions for Medical Image Datasets. In 22nd IEEE Symposium on Computer-Based Medical Systems (CBMS 2009), Albuquerque, 2009. Proceedings of the CBMS 2009.Los Alamitos : IEEE Computer Society, 2009.
  • KASTER, D., et al. Incorporating Metric Access Methods for Similarity Searching on Oracle Database. In 24'Simpósio brasileiro de Banco de Dados, Fortaleza, CE, 2009. Anais do 24' SBBD - Applications and Experiences Track. : Sociedade Brasileira de Computação, 2009.
  • BEDO, M. V. N., et al. Higiia: A Perceptual Medical CBIR System Applied to Mammography Classification. In Sessão de Demos do XXVII Simpósio Brasileiro de Banco de Dados ( SBBD), Sao Paulo, 2012. Anais do SBBD 2012 - Demos.SBC : Sociedade Brasileira de Computação, 2012.
  • Bueno, R., et al. A New Approach for Optimization of Dynamic Metric Access Methods Using an Algorithm of Effective Deletion. In 20th International Conference on Scientific and Statistical Database Management (SSDBM 2008), Hong Kong, 2008. Anais do SSDBM 2008., 2008.
  • Bueno, R., et al. Metric data analysis enhanced through temporal visualization. In 14th International Conference Information Visualisation (IV), Londres, 2010. Proc. of the IV 2010.Los Alamitos : IEEE Computer Society, 2010.
  • Bueno, R., et al. Time-aware Similarity Search: A Metric-Temporal Representation for Complex Data. In 11th International Symposium on Spatial and Temporal Databases (SSTD 2009), Aalborg. Proceedings of the SSTD 2009., 2009.
  • Bueno, R., et al. Using Visual Analysis to Weight Multiple Signatures to Discriminate Complex Data [doi:10.1109/IV.2011.59]. In 15th International Conference Information Visualisation (IV´2011), Londres, 2011. Proceedings of the IV´2011.Los Alamitos : IEEE Computer Society, 2011.
  • Bugatti, P.H., et al. Integrating user profile in medical CBIR systems to answer perceptual similarity queries [doi:10.1117/12.878095]. In SPIE Medical Imaging Conference 2011, Orlando, 2011. Progress in Biomedical Optics and Imaging.New York : SPIE, 2011.
  • Ponciano da Silva, Marcelo, et al. Does a CBIR system really impact decisions of physicians in a clinical environment?. In 26th IEEE International Symposium on Computer Based Medical Systems (CBMS 2013), Porto, 2013. Proceedings of the CBMS 2013.Los Alamitos : IEEE Computer Society, 2013.
  • Barioni, M. C. N., et al. Querying Multimedia Data by Similarity in Relational DBMS. In Li Yan, Zongmin Ma. Advanced Database Query Systems: Techniques, Applications and Technologies. Organizador. IGI Global : Hershey, 2011{Volume}. chap. 1, p. 323-359.http://www.teses.usp.br/teses/disponiveis/55/55134/tde-23072012-164717/
Todos os direitos da tese/dissertação são de seus autores
Centro de Informática de São Carlos
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2019. Todos os direitos reservados.