• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
10.11606/D.55.2003.tde-12112014-101732
Document
Author
Full name
Daniel Gomes Dosualdo
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2003
Supervisor
Committee
Rezende, Solange Oliveira (President)
Baranauskas, José Augusto
Coello, Juan Manuel Adán
Title in Portuguese
Investigação de regressão no processo de mineração de dados
Keywords in Portuguese
Não disponível
Abstract in Portuguese
Mineração de dados refere-se ao processo responsável por identificar padrões em grandes conjuntos de dados com o objetivo de extrair um novo conhecimento. Depois de extraídos os padrões, a etapa de pós-processamento tem como objetivo avaliar alguns aspectos desses padrões, como precisão, compreensibilidade e interessabilidade. Um dos problemas da mineração de dados preditiva conhecido como regressão tenta predizer o valor de um atributo-meta contínuo baseado em um conjunto de atributos de entrada. No entanto, a regressão em mineração de dados preditivo é uma questão pouco explorada nas áreas de aprendizado de máquina e mineração de dados, uma vez que a maioria das pesquisas são voltadas para os problemas de classificação. Por outro lado, o DISCOVER é um projeto que está sendo desenvolvido no Laboratório de Inteligência Computacional. Ele tem como objetivo fornecer um ambiente integrado para apoiar as etapas do processo de descoberta de conhecimento, oferecendo funcionalidades voltadas para aprendizado de máquina e mineração de dados e textos. O DISCOVER tem motivado a realização de muitos trabalhos em diversas áreas, sendo este mais um projeto a ele integrado. Para auxiliar na preparação dos dados para a construção de um modelo de regressão simbólico e na posterior avaliação desse modelo foi proposto e implementado neste trabalho o ambiente computacional DISCOVER POSTPROCESSING ENVIRONMENT OF REGRESSION - DiPER. Esse ambiente é composto por uma biblioteca de classes, implementada de acordo com as especificações do DISCOVER, que oferece uma série de métodos para serem utilizados na etapa de pós-processamento do processo de mineração de dados.
Title in English
Investigation of regression in the data mining process.
Keywords in English
Not available
Abstract in English
Data mining refers to the process which are able to find patterns from big amounts of data in order to discover knowledge. After found the patterns, the post-processing stage of Data Mining evaluates some aspects of these patterns such as precision, compreensibility and interessability. The activity of regression in Data Mining tries to predict the values of a continuous target variable based on a set of other variables. Beside the fact of many researches in Machine Learning and Data Mining are concerned to classification problems, there are many real world regression problems. This fact motivates the study of methods related to post-processing in symbolic regression. Moreover, a group of researchers of Computational Intelligence Laboratoiy (LABIC) is developing a research project, called DISCOVER. The aim of DISCOVER is to support the stages of knowledge discovery offering methods to Machine Learning, Data Mining and Text Mining. This work, that is related to regression problems, is one of the projects integrated into the DISCOVER. In this work we proposed and implemented a computational environment, the DISCOVER POST-PROCESSING ENVIRONMENT OF REGRESSION - DiPER - which is a framework implemented according the specifications of DISCOVER project, that offers a collection of methods to be used in the post-processing stage of Data Mining.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2014-11-12
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
Centro de Informática de São Carlos
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2020. All rights reserved.