• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.45.2018.tde-20230727-113344
Documento
Autor
Nombre completo
Lucas Tavares Short Cabral
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2018
Director
Título en portugués
Consenso Monte Carlo em modelos BART: priori, agregação e predição
Palabras clave en portugués
Algoritmos
Big Data
Inferência Estatística
Método De Monte Carlo
Resumen en portugués
Esse trabalho visa estudar em um contexto de Big Data o Bayesian Additive Regression Tree (BART) quando amostrado por um Consensus Monte Carlo (CMC). O BART é um modelo de regressão não-paramétrica que utiliza da soma várias árvores binárias com profundidade regulariza- das, via priori, para construir funções preditivas. Já o CMC é uma maneira de combinar amostras de Monte Carlo de diferentes computadores (ou de partições dos dados) e gerar uma aproximação da posteriori dos dados completos. Os objetivos do trabalho são estudar o comportamento das pri- oris nesse contexto em relação a capacidade de predição do modelo e verificar como se comporta seleção de variáveis do BART em um CMC. Para atingir o objetivo propõem-se uma nova maneira de agregar os resultados dos diferentes BART2019s no CMC usando a correlação de Pearson combinada a variância das predições realizadas por cada BART individual como peso. Os resultados mostram que o CMC do modelo BART é capaz de selecionar e predizer tão bem quanto o BART, com maior escalabilidade.
Título en inglés
Consensus Monte Carlo on BART models: prior, aggregation and predition
Resumen en inglés
This work study the Bayesian Additive Regression Tree (BART) when sampled by a Consensus Monte Carlo. BART is a non-parametric regression model that sum the outcome of many binary trees with regularized depth, via prior, to make predictions. On the other hand, CMC is a method to aggregate MCMC samples from different computers (or data shards) to generate an approxi- mation to the full data posterior. The objectives for this work are: study the impact of the priors choice in prediction of BART with CMC, and it2019s capability of variable selection. To accomplish the objective we suggest a new way to aggregate the consensus results from each BART in a CMC. This new aggregation method is based on Pearson2019s correlation and the variance of the predictions to generate the weights. The results shows that CMC-BART is able to select variable and make prediction as good as BART, but with more scalability.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-07-27
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.