• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.11.2020.tde-06052020-155239
Document
Author
Full name
Douglas Toledo Batista
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 2020
Supervisor
Committee
Lara, Idemauro Antonio Rodrigues de (President)
Montebello, Maria Imaculada de Lima
Taconeli, Cesar Augusto
Title in Portuguese
Modelos para dados de contagem não equidispersos com aplicação à ecologia e em estudos longitudinais
Keywords in Portuguese
Half-normal plot
Dados correlacionados
Distribuição de probabilidade
Macrófitas aquáticas
Modelos mistos
Progabide
Abstract in Portuguese
A obtenção de dados em forma de contagem é muito comum em pesquisas das áreas biológicas e o modelo de regressão Poisson é uma primeira alternativa de análise. No entanto, o modelo de Poisson exige independência, taxa constante de ocorrência e, com isso, variância igual a média. A condição de equidispersão limita seu uso em muitas aplicações, dado que essa relação nem sempre ocorre, podendo a variância ser menor (subdispersão) ou maior (superdispersão) do que a média. Como a ocorrência de dados superdispersos é mais comum do que dados subdispersos, houve um maior avanço em metodologias estatísticas na modelagem de dados com superdispersão. Porém, estudos com subdispersão têm surgido com maior regularidade, indicando que mais atenção é necessária para modelos que melhor expliquem essa estrutura de dados. No primeiro capítulo desta tese são abordados modelos alternativos para o problema da subdispersão, para o qual apresenta-se uma aplicação à ecologia. Como alternativas, foram propostos os modelos double Poisson, COM-Poisson, contagem gama e Poisson generalizada restrita. Essa classe de modelos é mais flexível parase trabalhar a subdispersão assim como a superdispersão (não equidispersão) presente nos dados, devido a presença de um parâmetro adicional. O fenômeno da não equidispersão também é comumente encontrado em dados de contagem longitudinais, isto é, quando a variável resposta em estudo é obtida repetidamente na mesma unidade amostral ao longo do tempo. Neste caso, modelos lineares generalizados mistos com a inclusão de efeitos aleatórios no preditor linear têm sido utilizados para acomodar a não equidispersão. No segundo capítulo é apresentada uma nova abordagem para análise de dados longitudinais com diferentes graus de dispersão, fundamentada na distribuição double Poisson em uma estrutura hierárquica. Para isso, utilizou-se uma variável dummy para particionar a sub- e superdispersão presente nos dados. A motivação deste estudo provém de um estudo clínico da literatura científica, que testa a eficiência de um medicamento na condição clínica de pacientes portadores de epilepsia. A estimação dos parâmetros foi realizada via máxima verossimilhança e o parâmetro de dispersão foi avaliado por meio do teste de razão de verossimilhança. A qualidade do ajuste dos modelos aos dados foi avaliada por meio da análise dos resíduos e, em particular, com o auxílio da técnica exploratória do gráfico meio normal de probabilidade.
Title in English
Models for non-equidispersed counting data with application to ecology and longitudinal studies
Keywords in English
Aquatic macrophytes
Correlated data
Half-normal plot
Mixed models
Probability distribution
Progabide
Abstract in English
The use of count data is very common in biological areas research and Poisson regression model is the first alternative method to analyze this type of data. However, the Poisson model requires independence, constant rate of occurrence, and thus, variance equal to media. The equidispersion condition limits its use in many applications, since this relationship does not always occur, where the variance may de smaller (underdispersion) or greater (overdispersion) than the average. Because overdispersion data is more common than undispersed data, there has been a major advance in statistical methodologies in overdispersion data modeling. However, examples of underdispersion studies have emerged more regularly, indicating that more attention is needed for models that better explain this data structure. In the first chapter of this series, alternative models for the underdispersion problem are discussed, for which an application in ecology is presented. Alternatively, double Poisson, COM-Poisson, Gamma count and restricted generalized Poisson models were proposed. This class of models is more flexible to deal with both under- and overdispersion in the data, due to the presence of an additional parameter. The non-equidispersion phenomenon is also commonly found in longitudinal count data, i.e., when a variable under study is repeatedly selected over time. In this case, generalized linear mixed models have been used, where additional normal random effects are included in the linear predictor to account for the non-equidispersion. The second chapter presents a new approach for longitudinal data analysis with different degrees of dispersion, based on double Poisson distribution in a hierarchical structure. For this, a dummy variable was used to partition the under- and overdispersion present in the data. The motivation of this study comes from a clinical study available in the scientific literature, which tested the efficacy of a drug in the clinical condition of patients with epilepsy. Parameter estimation was performed via maximum likelihood and the dispersion parameter was tested by the likelihood ratio test. The quality of the fit of the models was assessed by residual analysis and, in particular, with the help of the exploratory technique of the half-normal plot.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-05-07
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2020. All rights reserved.