• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2017.tde-20230727-113151
Documento
Autor
Nome completo
André Vinícius Lopes
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2017
Orientador
Título em português
Redes neurais convolucionais aplicadas ao projeto de operadores de imagens
Palavras-chave em português
Aprendizado Computacional
Imagem Digital
Redes Neurais
Resumo em português
O projeto de W-operadores de imagens requer a estimação de um operador local a partir de exemplos de treinamento e da indução de um classificador baseado em aprendizado de máquina para a classificação de exemplos pouco, ou nunca, observados no treinamento. Nos últimos anos, a ârea de aprendizado de máquina passou por um avanço muito grande devido às redes neurais convolucionais (CNN). Esse avanço é principalmente devido ao poder de representação das redes neurais e pelo fato das redes convolucionais serem efetivas na extração de características locais. Devido a isso, elas estão presentes em muitas soluções do estado da arte de diversos problemas de visão computacional [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. Neste trabalho, estudamos e exploramos o poder de representação das CNNs no contexto do projeto de W-operadores de imagens. Integramos implementações públicas e bastante maduras de CNN a uma biblioteca de projeto de W-operadores desenvolvida pelo nosso grupo (TRIOS) e testamos diversas estratégias para segmentar imagens de níveis de cinza ou, ainda, classificar os padrões de intensidades em níveis de cinza observados através de uma janela W em poucos rótulos (em geral, dois rótulos, ou O, ou 1). Para validar a proposta, usamos 2 conjuntos de dados de imagens de fundo de olho, chamados de DRIVE e STARE, os quais já são um padrão na área de imagens para a segmentação das veias da retina e também em um conjunto de dados chamado de STAFF (KFV+13, VKFJ13], o qual é uma variação do banco de dados CVC-MUSCIMA [FDGL12] e tem o objetivo de segmentar notas musicais em partituras. Os resultados obtidos mostram que, para uma janela razoavelmente grande, os resultados são satisfatórias ao se comparar com soluções específicas do estado da arte, as quais utilizam heurísticas de pré e pós-processamento.
Título em inglês
Convolutional neural networks model applied to construction of image operators
Resumo em inglês
The project of images W-operators requires the estimation of a local operator using training examples and the induction of a cla.55ifier based on machine learning to classify examples that are seldom or never seen during training. ln the last years, the area of machine learning advanced enormously due to the use of convolutional neural networks (CNN). This advance is caused mainly dueto the power of representation of the neural networks and due to the fact that the convolutional neural networks are effective in the extraction of local characteristics. Consequently, they are present in many state of the art solutions for problems of computer vision [MPGC 17, HGC+17, FTM+17, MZY+17, CGW+17]. ln this work we study and explore the power of representation of the CNN's in the context of images w-operators project. We integrate public implementations and very mature libraries of CNN and w-operators developed by our group (TRIOS) and test several strategies to segment gray-level images or to classify the gray-level intensity patterns observed through a window w in a few labels (in general, 2 labels, either O or 1). To validate this proposal we use 2 data sets of retina! images, called DRIVE and STARE which are commonly used for vessel segmentation of the retina and also in a data set called STAFF [KFV+13, VKFJ13], which is a variation of the database CVC-MUSCIMA [FDGL12] and has the objective of segmenting musical notes in partitures. The results have shown that, for a big window, the results are satisfactory when compared to specific state of the art solutions which use pre and post-processing.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
LopesAndreVinicius.pdf (10.48 Mbytes)
Data de Publicação
2023-07-27
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.