Doctoral Thesis
DOI
https://doi.org/10.11606/T.11.2020.tde-20200111-145225
Document
Author
Full name
Maria Cecilia Mendes Barreto
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 1993
Supervisor
Title in Portuguese
Uma extensão da técnica AID em modelos lineares generalizados
Keywords in Portuguese
ALGORITMOS AID
DISTRIBUIÇÕES
MODELOS LINEARES GENERALIZADOS
Abstract in Portuguese
Como as técnicas de agrupamentos de médias podem ser inadequadas na aplicação em dados com distribuição diferente da gaussiana. o algoritmo “Automatic Interaction Detection” (AID) é estendido adotando-se como medida de homogeneidade de grupos uma estatÃstica baseada na função desvio. Esta última pode ser utilizada em uma grande classe de modelos, conhecida como modelos lineares generalizados, que abrange modelos do tipo regressão, análise de variância, modelos logito e probito, modelos log-lineares, entre outros. Considerando um ensaio completamente ao acaso com K tratamentos e nk repetições por tratamento, o máximo da medida de homogeneidade de grupos e uma extensão do coeficiente de deter mi nação são obtidos em uma forma geral supondo que os dados tenham uma distribuição que pertença à famÃlia exponencial, e também no caso particular de distribuição· normal. binomial e Poisson. Supondo que os dados tenham distribuição binomial, a distribuição assintótica do máximo da medida de homogeneidade de grupos é obtida como sendo proporcional a uma distribuição qui-quadrado. Esses resultados são, também, uma extensão do procedimento de SCOTT & KNOTT (1974), para agrupamento de médias
Title in English
An extension of the AID technique in generalized linear models
Abstract in English
Since Clustering techniques for means can be inadequate for proportions with non-Gaussian data. The AID (Automatic Interaction Detection) algorithm is extended considering as measure of homogeneity of groups a statistics based on the deviance function. This can be used in a large class of models known as generalized linear models. These models have, as particular case, among others, standard regression and analysis of variance models, logit and probit models, log-linear models for contingency tables, etc. Considering a complety random design with K treatments and n replicates per treatment, the maximum nk of the groups homogeneity measure is obtained. Also, it is obtained an extension of the “determination coefficient” in a general form, supposing a distribution for the data in the exponential family; in particular the normal, binomial and Poisson cases are considered. Supposing a binomial distribution for the data, the asymptotic distribution for the maximum of the group homogeneity measure is obtained, i l is shown that it is proportional lo a chi-square distribution. These results are also, an extension of the procedures proposed by SCOTT & KNOTT (1974) for clustering means
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-01-11