Thèse de Doctorat
DOI
https://doi.org/10.11606/T.11.1991.tde-20210104-192102
Document
Auteur
Nom complet
Walter Veriano Valério Filho
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
Piracicaba, 1991
Directeur
Titre en portugais
Comparação de métodos para estimação de componentes da variância através de simulação de dados
Mots-clés en portugais
COMPONENTES DE VARIÂNCIA
ESTIMAÇÃO
SIMULAÇÃO
Resumé en portugais
Com o objetivo de comparar métodos de estimação de componentes da variância através da técnica de simulação de dados, optou-se pelos estimadores da análise da variância, da máxima verossimilhança e máxima verossimilhança restrita e pelos estimadores quadráticos imparciais de variância mínima. Todos estes métodos estão implantados no SAS (Statistical Analysis System) e são denotados respectivamente por: ANOVA (Analysis of Variance), ML (Maximum Likelihood), REML (Restricted Maximum Likelihood) e MIVQUEO (Minimum Variance Quadratic Unbiased Estimation). Estes estimadores foram utilizados em dois tipos de modelos mistos com dois fatores: o cruzado sem interação e o hierárquico. Na simulação dos dados para cada modelo foram definidos quatro valores para a variância associada ao fator aleatório (VARB = 0,25; 1,00; 4,00; 9,00), sempre tomando-se a variância associada ao resíduo igual a um (VARE = 1,00), três valores para o número de níveis de efeitos fixos e três para o número de níveis de efeitos aleatórios (A = 2, 4, 6 e B = 4, 6, 10) e para cada uma das 36 combinações anteriores, três níveis crescentes no grau de desbalanceamento (DESB = BA, W0, W1), sendo que o nível BA corresponde ao caso balanceado. Para cada uma das 108 possíveis combinações de VARB, A, B e DESB, foram simulados 50 experimentos, e dentro de cada experimento, as observações seguiam uma distribuição normal característica. Dois critérios de comparação foram utilizados na avaliação dos estimadores, o erro quadrático médio e o valor absolutos do viés. Os resultados indicaram que: a-) para o fator aleatório no modelo cruzado, o método REML foi o menos tendencioso, enquanto que o ML geralmente exibiu maior viés. Já em termos de erro quadrático, quando B foi mínimo, o ML mostrou melhor desempenho, e para B > 4 os métodos ANOVA e REML apresentaram-se como os melhores, nos casos de maior desbalanceamento; b-) para o resíduo no modelo cruzado, quando B = 4 e A < 6, o método ML apresentou o melhor desempenho, e para B > 4 e A > 2, os melhores foram os métodos ANOVA e REML; c-) para o fator aleatório no modelo hierárquico, notou-se que, no desbalanceamento e com VARB = 0,25, os mais próximos e menos tendenciosos foram os métodos ANOVA, MIVQUEO e REML, e para VARB > 0,25 e REML foi em geral o menos viesado. Em termos de erro quadrático, o método ML teve o melhor desempenho quando A = 2, e para A ≥ 4 e VARB > 0,25, destacou-se o método REML; d-) para o resíduo no modelo hierárquico, em casos de maior desbalanceamento e com VARB = 0,25, os métodos MIVQUEO, REML e ML apresentaram-se próximos e superaram o ANOVA em termos de erro quadrático, mas para VARB > 0,25, permaneceram os métodos ML, REML e ANOVA com os menores erros. Os métodos ML e REML foram os menos tendenciosos quando VARB e B foram mínimos. Acentuadamente no maior grau de desbalanceamento com B máximo e para VARB crescente o método ANOVA apresentou-se como o menos tendencioso; e-) nos casos balanceados, ocorreu uma tendência de equivalência entre os métodos: ANOVA, MIVQUEO e REML, à medida em que VARB, A e B tiveram acréscimos simultâneos ou não; f-) nos casos desbalanceados em geral, os métodos ML, ANOVA e principalmente o REML apresentaram frequentemente os melhores resultados, enquanto que o MIVQUEO raramente superou os demais.
Titre en anglais
Methods comparison to estimate variance componentes by data simulation
Mots-clés en anglais
Resumé en anglais
To compare variance components estimation methods by data simulation technique, it has been choosed analysis of variance, maximum likelihood, restricted maximum likelihood and minimum variance quadratic unbiased estimators. All the methods are implanted in SAS (Statistical Analysis System) software and respectively named as ANOVA (Analysis of Variance), ML (Maximum Likelihood), REML (Restricted Maximum Likelihood) and MIVQUEO (Minimum Variance Quadratic Unbiased Estimation). estimators implanted in (SAS). These estimators were utilized in two mixed model types, with two factors: the two-way crossed classification without interaction and two-way crossed classification without interaction and two-way nested classification. On data simulation four each model, four variance values associated to the random factor were defined (VARB = 0,25; 1,00; 4,00; 9,00), always atributing values one to the variance associated to error (VARE = 1,00), three values for the fixed effect levels and random effect levels number (A = 2, 4, 6 and B = 4, 6, 10) and for each of 36 anterior combinations, three crescent levels at unbalancing grade (DESB = BA, W0, W1), here with BA level corresponding to the balanced cases. For each one of the 108 VARB, A, B and DESB combinations, 50 experiments were simulated, and in each experiment, the observation followed a characteristic normal distribution. Two comparative criterions were utilized on estimators evaluation, the mean quadratic error and ablsolute values bias. The results indicated that: a-) for the random fator of the two-way crossed classification, REML method eas the less biased, while the ML often exhibited a greater bias. In relation to quadratic error, when B was minimum, ML showed better performance, and for B > 4 the ANOVA and REML methods showed the best performance, in the cases of grater unbalancing; b-) for the error on the two-way crossed classification model, when B = 4 and A < 6, the ML method showed the best performance, and for B > 4 and A > 2, ANOVA and REML were the best methods; c-) for the random factor on the two-way nested classification model, it has been observed that, on unbalancing and with VARB = 0.25, the closer and the less biasad methods were ANOVA, MIVQUEO and REML, and for VARB > 0,25 generally REML was the less biased. In relation to quadratic error, the ML method had the best performance when A = 2, and for A ≥ 4 and VARB > 0.25, REML method exceeds; d-) for the error on the two-way nested classification model, in cases of greater unbalancing and with VARB = 0, 25, MIVQUEO, REML and ML methods showed closer and surpassed ANOVA by means of quadratic error, but for VARB > 0.25, ML, REML and ANOVA, methods showed the least errors. The ML and REML methods were the less tendentious when VARB and B were the minimum. Accentuating on a greater unbalancing grade with maximum B and for crescent VARB, the ANOVA method showed the less biased; e-) on the balanced cases, occurred an equivalence tendency between ANOVA, MIVQUEO and REML methods, when VARB, A and B had simultaneous additions or not; f-) generally, on the unbalanced cases, the ML, ANOVA methods and mainly the REML frequently presented better profit while the MIVQUEO rarely exceeded the other ones.
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2021-01-07
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées
cliquant ici.