• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.45.2005.tde-20210729-141428
Documento
Autor
Nombre completo
Fábio Natanael Kepler
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2005
Director
 
Título en portugués
Um etiquetador morfo-sintático baseado em cadeias de Markov de tamanho variável
Palabras clave en portugués
Linguística Computacional
Resumen en portugués
Dado um texto, queremos atribuir a cada palavra, de acordo com seu contexto, uma categoria morfo-sintática. Para isto, implementamos dois etiquetadores morfo-sintáticos baseados em cadeias de Markov. Primeiro, utilizando uma abordagem bastante conhecida, construímos um etiquetador que usa cadeias de Markov de ordem fixa igual a dois. Então, propomos e implementamos outro etiquetador utilizando uma abordagem recente, baseada em cadeias de Markov de tamanho variável. Depois de mostrar a teoria estatística dos dois modelos e os problemas e desafios mais comuns a serem resolvidos, explicamos o funcionamento dos etiquetadores e expomos os resultados obtidos. Com estes resultados, obtemos uma comparação mais precisa da eficiência destes dois modelos aplicados à etiquetagem morfo-sintática, identificando pontos fortes e fracos de cada um. Por uma combinação de fatores, consideramos o etiquetador com cadeias de Markov de tamanho variável melhor do que o de ordem fixa, e alcançamos um dos melhores resultados em etiquetagem morfo-sintática do português atualmente: 95,51% de precisão, obtida em um tempo total de execução, incluindo o aprendizado e etiquetagem de mais de um milhão de palavras, de menos de três minutos. Contribuímos, assim, com o estado da arte da área e, além disso, fornecemos resultados que nos permitem observar limitações e vantagens da aplicação de modelos estatísticos, em geral, ao problema focado, que podem ajudar a comunidade a identificar pontos críticos sobre os quais as pesuqisas nessa área deverão procurar se concentrar.
 
Título en inglés
not available
Resumen en inglés
not available
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2021-07-29
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores.
CeTI-SC/STI
© 2001-2024. Biblioteca Digital de Tesis y Disertaciones de la USP.