• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
10.11606/D.55.2002.tde-22062015-202748
Document
Auteur
Nom complet
Lea Silvia Martins Gonçalves
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Carlos, 2002
Directeur
Jury
Rezende, Solange Oliveira (Président)
Carvalho, André Carlos Ponce de Leon Ferreira de
Pozo, Aurora Trinidad Ramirez
Titre en portugais
Categorização em Text Mining
Mots-clés en portugais
Não disponível
Resumé en portugais
Os avanços tecnológicos e científicos ocorridos nas últimas décadas têm proporcionado o desenvolvimento de métodos cada vez mais eficientes para o armazenamento e processamento de dados. Através da análise e interpretação dos dados, é possível obter o conhecimento. Devido o conhecimento poder auxiliar a tomada de decisão, ele se tornou um elemento de fundamental importância para diversas organizações. Uma grande parte dos dados disponíveis hoje se encontra na forma textual, exemplo disso é o crescimento vertiginoso no que se refere à internet. Como os textos são dados não estruturados, é necessário realizar uma série de passos para transformá-los em dados estruturados para uma possível análise. O processo denominado de Text Mining é uma tecnologia emergente e visa analisar grandes coleções de documentos. Esta dissertação de mestrado aborda a utilização de diferentes técnicas e ferramentas para Text Mining. Em conjunto com o módulo de Pré-processamento de textos, projetado e implementado por Imamura (2001), essas técnicas e ferramentas podem ser utilizadas para textos em português. São explorados alguns algoritmos utilizados para extração de conhecimento de dados, "como: Vizinho mais Próximo, Naive Bayes, Árvore de Decisão, Regras de Decisão, Tabelas de Decisão e Support Vector Machines. Para verificar o comportamento desses algoritmos para textos em português, foram realizados alguns experimentos.
Titre en anglais
Text mining categorization
Mots-clés en anglais
Not available
Resumé en anglais
The technological and scientific progresses that happened in the last decades have been providing the development of methods that are more and more efficient for the storage and processing of data. It is possible to obtain knowledge through the analysis and interpretation of the data. Knowledge has become an element of fundamental importance for several organizations, due to its aiding in decision making. Most of the data available today are found in textual form, an example of this is the Internet vertiginous growth. As the texts are not structured data, it is necessary to accomplish a series of steps to transform them in structured data for a possible analysis. The process entitled Text Mining is an emergent technology and aims at analyzing great collections of documents. This masters dissertation approaches the use of different techniques and tools for Text Mining, which together with the Text pre-processing module projected and implemented by Imamura (2001), can be used for texts in Portuguese. Some algorithms, used for knowledge extraction of data, such as: Nearest Neighbor, Naive Bayes, Decision Tree, Decision Rule, Decision Table and Support Vector Machines, are explored. To verify the behavior of these algorithms for texts in Portuguese, some experiments were realized.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2015-06-23
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
Centro de Informática de São Carlos
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2020. Tous droits réservés.