• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.11.2020.tde-20200111-144800
Document
Author
Full name
Sérgio Minoru Oikawa
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 1998
Supervisor
Title in Portuguese
Hipóteses estatísticas com dados desbalanceados nos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial
Keywords in Portuguese
ANÁLISE DE DADOS
DELINEAMENTO EXPERIMENTAL
HIPÓTESES
MODELOS MATEMÁTICOS
SOFTWARES ESTATÍSTICOS
Abstract in Portuguese
Os softwares estatísticos tornaram-se uma ferramenta importante e indispensável na análise estatística de dados, principalmente, devido à capacidade dos computadores de hoje, tais como sua grande rapidez e seu baixo custo operacional por unidade aritmética. Tais características, bem como a facilidade de acesso, fizeram com que o número de usuários de softwares estatísticos crescesse consideravelmente. Infelizmente, as dificuldades encontradas pelos usuários de softwares estatísticos têm sido agravadas pela escassez de informações detalhadas sobre as interpretações de hipóteses estatísticas em modelos mais complexos com dados desbalanceados, tanto na literatura como nos manuais de utilização. Assim, a ausência de manuais bem documentados na maioria dos softwares, tem induzido muitos usuários a cometerem erros de interpretação das hipóteses que podem comprometer os resultados de sua pesquisa. Nesse contexto, um dos objetivos naturais desse trabalho, foi o estudo dos modelos de efeitos fixos hierarquizados em presença ou não de esquema fatorial com dados desbalanceados. Para esses modelos, formalizaram-se os termos das respectivas somas de quadrados e hipóteses estatísticas mais usuais que são testadas para os efeitos principais e interações. Discutiu-se, também, o problema da interpretação de hipóteses associadas às somas de quadrados fornecidas por alguns dos sistemas computacionais estatísticos universalmente consagrados. Visando ampliar os horizontes dos profissionais das ciências aplicadas, usuários de sistemas computacionais estatísticos disponíveis em seus centros de pesquisa, compararam-se as performances de alguns sistemas como o SAS, o MINIT AB, o GLIM, o BMDP, o STATGRAPHICS, o STATISTICA, o SAEG, o SANEST e o NTIA. Face aos resultados, concluiu-se que: - Quando os dados são desbalanceados com todas as caselas ocupadas, porém os níveis do fator C são diferentes, as somas de quadrados referentes ao fator A fornecidas pelo SAS-GLM, não testam as hipóteses sobre as médias não ponderadas proposto por Yates (1934), mas uma hipótese não usual, gerada a partir de funções estimáveis complexas do tipo IH. - As somas de quadrados parciais referentes ao fator A fornecidas pelo NTIA, também não testam as hipóteses sobre as médias não ponderadas, quando os dados são desbalanceados e os níveis do fator C são diferentes. - A ocorrência de dados desbalanceados em presença de caselas vazias pode trazer sérios transtornos aos pesquisadores das ciências aplicadas, com relação às interpretações de hipóteses estatísticas, pois na maioria dos casos, a falta de uma documentação explícita sobre o que esses softwares estão calculando, pode induzir a tomada de decisões incorretas
Title in English
Statistical hypotheses with unbalanced data in the models of nested fixed effects in presence or not of scheme factorial
Abstract in English
The statistical softwares became an important and indispensable tool in the statistical analysis of data, mainly, due to the capacity of the computers today, such as its great speed and its low operational cost for arithmetic unit. Such characteristic, as well as the access easiness, caused the number of users of statistical softwares to grow considerably. Unfortunately, the difficulties found by the users of statistical softwares have been worsened by the lack of detailed information about the interpretations of statistical hypotheses in more complex models with unbalanced data, either in the literature or in the use manuals. Thus, the absence of manuals well documented in most of the softwares, has been inducing many users they to make misinterpretations of the hypotheses which can commit the results of their research. In that context, one of the natural objectives of this work, was the study of the models of nested fixed effects in presence or not of scheme factorial with unbalanced data. For those models, the terms of the respective sums of squares and more usual statistical hypotheses than they are tested for the main effects and interactions were formalized. The problem of the interpretation of hypotheses associated to the sums of squares provided universally by some of the systems statistical computational consecrated were also discussed. Seeking to enlarge the professionals' of the applied sciences horizons, users of available statistical computational systems in their research centers, the performance of some systems as the SAS ones, MINITAB, GLIM, BMDP, STATGRAPHICS, STATISTICA, SAEG, SANEST and NTIA were compared. According to the results, it was found that: - When the data are unbalanced with all the cells filled, but the leveIs of the factor C are different, then the sums of squares referring to the factor A supplied by the SAS-GLM don't test the hypotheses on the non-pondered averages proposed by Yates (1934), but a unusual hypothesis, generated from complex estimable functions of the type III. The sums of squares partial referring the factor A supplied by NTIA, also don’t test the hypotheses on the non-pondered averages, when the data are unbalanced and the leveIs of the factor C are different. - The occurrence of unbalanced data in presence of empty cells can bring serious upset to the researchers of the applied sciences, regarding the interpretations of statistical hypotheses, because in most of the cases, the lack of an explicit documentation about what those softwares are calculating, can induce the taking of incorrect decisions
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-01-11
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.