• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.45.2018.tde-20230727-113344
Document
Auteur
Nom complet
Lucas Tavares Short Cabral
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2018
Directeur
Titre en portugais
Consenso Monte Carlo em modelos BART: priori, agregação e predição
Mots-clés en portugais
Algoritmos
Big Data
Inferência Estatística
Método De Monte Carlo
Resumé en portugais
Esse trabalho visa estudar em um contexto de Big Data o Bayesian Additive Regression Tree (BART) quando amostrado por um Consensus Monte Carlo (CMC). O BART é um modelo de regressão não-paramétrica que utiliza da soma várias árvores binárias com profundidade regulariza- das, via priori, para construir funções preditivas. Já o CMC é uma maneira de combinar amostras de Monte Carlo de diferentes computadores (ou de partições dos dados) e gerar uma aproximação da posteriori dos dados completos. Os objetivos do trabalho são estudar o comportamento das pri- oris nesse contexto em relação a capacidade de predição do modelo e verificar como se comporta seleção de variáveis do BART em um CMC. Para atingir o objetivo propõem-se uma nova maneira de agregar os resultados dos diferentes BART2019s no CMC usando a correlação de Pearson combinada a variância das predições realizadas por cada BART individual como peso. Os resultados mostram que o CMC do modelo BART é capaz de selecionar e predizer tão bem quanto o BART, com maior escalabilidade.
Titre en anglais
Consensus Monte Carlo on BART models: prior, aggregation and predition
Resumé en anglais
This work study the Bayesian Additive Regression Tree (BART) when sampled by a Consensus Monte Carlo. BART is a non-parametric regression model that sum the outcome of many binary trees with regularized depth, via prior, to make predictions. On the other hand, CMC is a method to aggregate MCMC samples from different computers (or data shards) to generate an approxi- mation to the full data posterior. The objectives for this work are: study the impact of the priors choice in prediction of BART with CMC, and it2019s capability of variable selection. To accomplish the objective we suggest a new way to aggregate the consensus results from each BART in a CMC. This new aggregation method is based on Pearson2019s correlation and the variance of the predictions to generate the weights. The results shows that CMC-BART is able to select variable and make prediction as good as BART, but with more scalability.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2023-07-27
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.