Tese de Doutorado
DOI
https://doi.org/10.11606/T.11.2020.tde-20200111-132820
Documento
Autor
Nome completo
Fernando Ferrari
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
Piracicaba, 1989
Orientador
Título em português
Estimadores viesados para modelos de regressão em presença de multicolinearidade
Palavras-chave em português
COMPONENTES PRINCIPAIS
ESTIMADORES
MODELOS DE REGRESSÃO LINEAR
MULTICOLINEARIDADE
Resumo em português
No presente trabalho, analisou-se o desempenho de dois estimadores viesados, a saber, o estimador sobre cristas e o estimador em componentes principais, como métodos alternativos ao estimador de mínimos quadrados no ajuste de modelos de regressão, quando os dados têm problemas de multicolinearidade. Para tanto, considerou-se o modelo de regressão linear múltipla: Y = Xβ + ε onde, y = vetor de observações da variável dependente na forma padronizada, de dimensões nx1. X = Matriz dos valores das variáveis independentes na forma padronizada, de dimensões nxp, de posto p < n; β = Vetor de constantes desconhecidas, de dimensões px1 ; ε = vetor de erros aleatórios não observáveis, de dimensões nx1, tal que E(ε) = Ø e E(εε) = σ2 In. Como as variáveis independentes e a variável dependente são consideradas na forma padronizada, XX é a matriz de correlações entre as variáveis independentes , e X y é o vetor de correlações entre as variáveis independentes e a variável dependente. Para obter-se uma maior abrangência nas comparações entre os estimadores adotados, procedeu-se a um estudo de simulação, onde foram analisados dois modelos distintos, conforme o número p de variáveis independentes envolvidas. Também foram analisados dois valores para o número n de observações sobre cada variável independente. Em cada um desses modelos, foram considerados quatro configurações, segundo uma estrutura de correlação, que foi estabelecida entre as variáveis independentes. Como critérios de comparações, entre os métodos de estimação abordados, consideraram-se:
Título em inglês
Biased estimators for regression models in the presence of multicollinearity
Resumo em inglês
This work consists of fitting linear models on data having problems of multicollinearity, and analyses two biased estimators, namely, the ridge regression estimator, and the principal components estimator. These estimators are considered as alternatives to the least square estimator. For this purpose the following multiple linear regression model was considered: Y = Xβ + ε where y is an nx1 response vector in the standardized form; x is an nxp full column rank matrix of n observation on p regressor variables in the standardized form; β is a px1 parameter-vector; ε is a nx1 vector unobservable random-errors, with E(ε) = Ø e E(εε) = σ2 In. As the regressor variables and the response variables are considered in the standardized form, XX is the correlation matrix between the regressor variables, and xy is the vector of correlation between the regressor variables and the response variables. To get a broader scope the comparisons of the adopted estimators, simulations were made, where two distinct models were analysed according to the number p of independent variables involved. Two values for the number n of observations about each independent variable were also analysed. In each of these models four configurations, according to a structure of correlation which was established among the independent variables, were considered. The following two criteria of comparisons among the methods of estimators studied, were considered : 1 - L21 = ( b - β )(b - β ) to measure estimation accuracy, and 2 -L22 = (b -β) XX( b - β) to measure prediction accuracy so that the values of b in L21 e L22 refer to the estimators considered, namely, least squares, ridge regression and principal components regression estimators.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2020-01-11