Doctoral Thesis
DOI
https://doi.org/10.11606/T.11.2019.tde-20191220-113413
Document
Author
Full name
Cecilia Candolo
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 2001
Supervisor
Title in Portuguese
A incorporação da incerteza devido à escolha de modelos na inferência estatística com aplicação em modelos de regressão linear
Keywords in Portuguese
INFERÊNCIA ESTATISTICA
MODELOS MATEMÁTICOS
REGRESSÃO LINEAR
Abstract in Portuguese
Uma abordagem típica de análise estatística consiste em vários estágios: exploração descritiva do conjunto de dados, definição da classe de modelos a ser considerada, seleção do melhor modelo dentro desta classe de acordo com algum critério pré-estabelecido e obtenção de inferências baseadas no modelo selecionado. Este ciclo é geralmente iterativo e envolve, além da aplicação dos conceitos e técnicas estatísticas, também considerações subjetivas. A conclusão obtida ao final deste processo depende do(s) modelo(s) escolhido(s), sem levar em consideração a incerteza devida à escolha do(s) modelo(s), o que pode resultar na subestimação da variabilidade de quantidades de interesse e em inferências super-otimistas ou viciadas. Este trabalho considera o problema de como incorporar a incerteza devido à escolha do modelo na inferência estatística aplicando a abordagem de Buckland et al. (1997), que propuseram um estimador ponderado para um parâmetro comum a todos modelos em estudo, sendo que os pesos desta ponderação são obtidos a partir do uso de critérios de informação ou do método bootstrap. Esta abordagem é aplicada a modelos de regressão linear e comparada com o procedimento usual de escolha de um modelo, com ponderação Bayesiana de modelos e com o uso do método bootstrap. O estimador ponderado apresentou erro quadrático médio substancialmente reduzido nas situações em que os coeficientes da regressão são pouco significativos, e comportamento similar ao estimador obtido via ponderação Bayesiana de modelos e com o uso do método bootstrap
Title in English
Incorporating model selection uncertainty into statistical inference in linear regression
Abstract in English
Statistical data analysis typically has several stages: exploration of the data set; deciding on a class or classes of models to be considered; selecting the best of them according to some criterion and making inferences based on the selected model. The cycle is usually iterative and will involve subject-matter considerations as well as statistical insights. The conclusion reached after such a process depends on the model(s) selected, but the consequent uncertainty is not usually incorporated into the inference. This may lead to underestimation of the uncertainty about quantities of interest and overoptimistic and biased inferences. This work consider the problem of how to incorporate model selection uncertainty into statistical inference appliying the approach of Buckland et al. (1997), who proposed a weighted estimator of a parameter common to all models under study, where the weights are obtained using information criteria or the bootstrap. This approach is applied to linear regression models and compared with the usual model-choice framework, with Bayesian model averaging and the bootstrap. The weighted estimator behaves similarly to model averaging and the bootstrap, with smaller mean squared error than the usual model-selection based estimator when the regression coeficients are not significant.
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2019-12-20