• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
10.11606/T.3.2014.tde-10112015-112734
Document
Author
Full name
Fernando Elias Corrêa
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2014
Supervisor
Committee
Almeida Junior, Jorge Rady de (President)
Bacchi, Mirian Rumenos Piedade
Gama, João Manuel Portela da
Hirakawa, Andre Riyuiti
Rodrigues, Luiz Henrique Antunes
Title in Portuguese
Modelo integrado de mineração de dados para análise de séries temporais de preços de indicadores agroeconômicos.
Keywords in Portuguese
Agroeconômicos
Data Mining
Identificação de padrões
Séries temporais
Trajetórias temporais
Abstract in Portuguese
Um dos principais setores da economia brasileira, o agronegócio envolve uma série de negociações dentro de toda a cadeia produtiva. Instituições de pesquisa como o CEPEA (Centro de Estudos Avançados em Economia Aplicada), da ESALQ/USP, coletam diariamente dados sobre diversos produtos agropecuários, gerando informações para agentes de diferentes categorias interessados no acompanhamento desses mercados, entre eles pesquisadores, produtores e formuladores de políticas públicas. O uso desses dados para realização de análises históricas integradas com análises atuais de mercado, porém, ainda é um desafio, dada a falta de uma padronização e a necessidade de identificação de técnicas computacionais adequadas. O objetivo desta tese é organizar as informações agroeconômicas consolidadas por meio de modelos de Data Mining e estatísticos para gerar análises integradas de relações entre as séries temporais, compreendendo produtos, mercados e o tempo, baseando-se nos dados obtidos pelo CEPEA em 7 anos de coleta diária de preços. As técnicas propostas para o modelo de análise integrada compreendem séries temporais para a projeção de trajetórias temporais e reconhecimento de padrões temporais. Especificamente para as trajetórias temporais, as técnicas utilizadas são de Matrizes de Correlações e Decomposição de Tucker e trajetórias, as quais permitem uma redução das matrizes e identificação de pontos relevantes no conjunto de dados. Já o reconhecimento de padrões nas séries temporais de grande volume de dados é obtido por meio de duas fases. Inicialmente, os dados são preparados utilizando-se as técnicas de redução de dimensionalidade e discretização. Posteriormente, é realizada a busca por motifs, que se utiliza de métricas de distâncias para encontrar similaridades entre as séries temporais ou entre sub partes de uma mesma série temporal para estas, destaca-se a aplicação do MINDIST e das distâncias euclidianas. Os resultados obtidos do modelo integrado são reportados em dois estudos de casos, sendo o primeiro sobre trajetórias temporais e o segundo, sobre identificação de padrões temporais. O conjunto de dados utilizado para ambos os casos foram preços comercialização de grãos no mercado interno do Brasil e valores negociados em Bolsa de valores de Chicago-EUA.
Title in English
Data mining model for analysis of prices indices Agroeconomic time series.
Keywords in English
Agribusiness
Data Mining
Motifs
Temporal trajectory
Time series
Abstract in English
One of the main activities economy sector in Brazil is agribusiness and involves several negotiations within the entire supply chain. Researchers Centers, as example CEPEA (Center for Advanced Studies on Applied Economics) from ESALQ / USP, collect daily data of agricultural products, generating information for players and staff of several categories for these markets, including researchers, producers and governmental. These historical data of agricultural market is used to create integrated analyses. However, it is still a challenge deal with the data standard or which statistical techniques is appropriated in order to perform a data analysis. The aim of the thesis is to provide an Agrieconomics analyses by data mining and statistical models, analyzing the relationship between time series, products, markets and time, based on dataset from CEPEA over seven years of daily prices. In order to understand the behaviors and patterns of these time series, two case studies were produced. The first case study was temporal trajectories, the techniques used were Correlations Matrix, Tucker Decomposition and trajectories, which allow a reduction of the matrices and identification of relevant points in the data set. The second case study applied was the patterns identification, where the main idea was understand and highlight events that happens frequently over seven year of daily grain prices quotation in several products. In order to proceed the technique, the data are prepared using the dimensionality and discretization reduction. Next, the search for motifs is performed using metrics distance to find similarities in time series or between parts of the same time series, in special two time series was used, that are MINDIST and Euclidean distances. The results give a understanding of the dynamic of these grains time series, such as, Some important aspects were detect by applying the trajectories, first that the both products soybean and corn prices has opposites trajectories, it is possible to infer this products competes in fields for next crops. On the market analysis, the trajectory of Chicago Stock Market spread the behavior of the prices in Brazil domestic market, both trajectories are similar over the years.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2015-11-12
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
Centro de Informática de São Carlos
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2020. All rights reserved.