• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2018.tde-20230727-113344
Documento
Autor
Nome completo
Lucas Tavares Short Cabral
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2018
Orientador
Título em português
Consenso Monte Carlo em modelos BART: priori, agregação e predição
Palavras-chave em português
Algoritmos
Big Data
Inferência Estatística
Método De Monte Carlo
Resumo em português
Esse trabalho visa estudar em um contexto de Big Data o Bayesian Additive Regression Tree (BART) quando amostrado por um Consensus Monte Carlo (CMC). O BART é um modelo de regressão não-paramétrica que utiliza da soma várias árvores binárias com profundidade regulariza- das, via priori, para construir funções preditivas. Já o CMC é uma maneira de combinar amostras de Monte Carlo de diferentes computadores (ou de partições dos dados) e gerar uma aproximação da posteriori dos dados completos. Os objetivos do trabalho são estudar o comportamento das pri- oris nesse contexto em relação a capacidade de predição do modelo e verificar como se comporta seleção de variáveis do BART em um CMC. Para atingir o objetivo propõem-se uma nova maneira de agregar os resultados dos diferentes BART2019s no CMC usando a correlação de Pearson combinada a variância das predições realizadas por cada BART individual como peso. Os resultados mostram que o CMC do modelo BART é capaz de selecionar e predizer tão bem quanto o BART, com maior escalabilidade.
Título em inglês
Consensus Monte Carlo on BART models: prior, aggregation and predition
Resumo em inglês
This work study the Bayesian Additive Regression Tree (BART) when sampled by a Consensus Monte Carlo. BART is a non-parametric regression model that sum the outcome of many binary trees with regularized depth, via prior, to make predictions. On the other hand, CMC is a method to aggregate MCMC samples from different computers (or data shards) to generate an approxi- mation to the full data posterior. The objectives for this work are: study the impact of the priors choice in prediction of BART with CMC, and it2019s capability of variable selection. To accomplish the objective we suggest a new way to aggregate the consensus results from each BART in a CMC. This new aggregation method is based on Pearson2019s correlation and the variance of the predictions to generate the weights. The results shows that CMC-BART is able to select variable and make prediction as good as BART, but with more scalability.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2023-07-27
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.