• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tese de Doutorado
DOI
10.11606/T.55.2007.tde-07052007-155746
Documento
Autor
Nome completo
Gisele Busichia Baioco
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Carlos, 2007
Orientador
Banca examinadora
Traina, Agma Juci Machado (Presidente)
Carvalho, André Carlos Ponce de Leon Ferreira de
Fortes, Renata Pontin de Mattos
Souza, Fernando da Fonseca de
Souza, Jano Moreira de
Título em português
Modelo de custo para consultas por similaridade em espaços métricos
Palavras-chave em português
Consultas por similaridade
Estimativa de seletividade
Modelo de custo
Resumo em português
Esta tese apresenta um modelo de custo para estimar o número de acessos a disco (custo de I/O) e o número de cálculos de distância (custo de CPU) para consultas por similaridade executadas sobre métodos de acesso métricos dinâmicos. O objetivo da criação do modelo é a otimização de consultas por similaridade em Sistemas de Gerenciamento de Bases de Dados relacionais e objeto-relacionais. Foram considerados dois tipos de consultas por similaridade: consulta por abrangência e consulta aos k-vizinhos mais próximos. Como base para a criação do modelo de custo foi utilizado o método de acesso métrico dinâmico Slim-Tree. O modelo estima a dimensão intrínseca do conjunto de dados pela sua dimensão de correlação fractal. A validação do modelo é confirmada por experimentos com conjuntos de dados sintéticos e reais, de variados tamanhos e dimensões, que mostram que as estimativas obtidas em geral estão dentro da faixa de variação medida em consultas reais
Título em inglês
Cost model for similarity queries in metric spaces
Palavras-chave em inglês
Cost model
Selectivity estimation
Similarity queries
Resumo em inglês
This thesis presents a cost model to estimate the number of disk accesses (I/O costs) and the number of distance calculations (CPU costs) to process similarity queries over data indexed by dynamic metric access methods. The goal of the model is to optimize similarity queries on relational and object-relational Database Management Systems. Two types of similarity queries were taken into consideration: range queries and k-nearest neighbor queries. The dynamic metric access method Slim-Tree was used as the basis for the creation of the cost model. The model takes advantage of the intrinsic dimension of the data set, estimated by its correlation fractal dimension. Experiments were performed on real and synthetic data sets, with different sizes and dimensions, in order to validate the proposed model. They confirmed that the estimations are accurate, being always within the range achieved executing real queries
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
tese_final.pdf (1.17 Mbytes)
siginifica que o arquivo pode ser somente acessado dentro da Universidade de São Paulo.
Data de Publicação
2007-05-08
 
AVISO: O material descrito abaixo refere-se a trabalhos decorrentes desta tese ou dissertação. O conteúdo desses trabalhos é de inteira responsabilidade do autor da tese ou dissertação.
  • BAIOCO, G. B., TRAINA, A. J. M., and TRAINA JR, Caetano. An Effective Cost Model for Similarity Queries in Metric Spaces. In 22nd ACM Symposium on Applied Computing (SAC), Seul, 2007. Proceedings of the 22nd ACM SAC 2007.New York : ACM Press, 2007. Abstract.
  • BAIOCO, G. B., TRAINA, A. J. M., and TRAINA JR, Caetano. MAMCost: Global and Local Estimates leading to Robust Cost Estimation of Similarity Queries [doi:10.1109/ssdbm.2007.17]. In 19th International Conference on Scientific and Statistical Database Management (SSDBM 2007), Banff, 2007. Proceedings of the SSDBM 2007.Los Alamitos : IEEE Computer Society, 2007.
Todos os direitos da tese/dissertação são de seus autores
Centro de Informática de São Carlos
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2020. Todos os direitos reservados.