• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.11.2020.tde-20200111-150114
Document
Author
Full name
Jeanete Alves Moreira
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 2001
Supervisor
Title in Portuguese
Utilização do método bootstrap na escolha entre os modelos de cox e logístico para dados de sobrevivência com censura intervalar
Keywords in Portuguese
ANÁLISE DE SOBREVIVÊNCIA
MELÃO
MODELOS MATEMÁTICOS
PRODUTIVIDADE
REAMOSTRAGEM BOOTSTRAP
Abstract in Portuguese
Em muitos trabalhos científicos, o interesse dos pesquisadores está em identificar variáveis ou fatores que influenciem no tempo de ocorrência de um determinado evento, o qual geralmente é conhecido como tempo de falha. Nem sempre, porém, é possível observar o tempo exato de ocorrência da falha, conhecendo-se somente o intervalo em que a mesma ocorreu. Dados deste tipo são conhecidos como agrupados ou de sobrevivência com censura intervalar e apresentam observações empatadas. Quando o número de empates é pequeno, a análise desses dados pode ser feita através do ajuste do modelo de Cox (Cox, 1972) considerando-se aproximações para a verossimilhança parcial. No caso de ocorrerem muitos empates, deve-se considerar o tempo como discreto e modelar a probabilidade de ocorrência do evento num determinado intervalo, dado que ele não ocorreu no intervalo imediatamente anterior. Isto pode ser feito considerando-se a variável resposta como uma variável indicadora de falha, que é binária, e ajustando-se os modelos de Cox para dados agrupados ou o modelo logístico, através dos modelos lineares generalizados com funções de ligação complemento log-log e logit, respectivamente. Após o ajuste dos modelos, existe o interesse em selecionar qual deles melhor se adequa aos dados experimentais. Para isto, algumas técnicas de seleção de modelos estão disponíveis na literatura, como o Critério de Informação de Akaike (Akaike, 1973), os Testes Escores propostos por Colosimo et al. (2000), dentre outras. Este trabalho propõe uma nova metodologia para a seleção entre os modelos de Cox e logístico para dados de sobrevivência com censura intervalar, utilizando o método de reamostragem bootstrap dos resíduos. Isto é feito extraindo-se os resíduos dos ajustes dos modelos propostos e calculando-se a diferença de deviances entre os modelos ajustados. Após isto, as novas observações são recompostas a partir dos resíduos bootstrap e novas diferenças de deviances são calculadas. Um histograma para esses valores é, então, obtido e um nível de significância empírico é proposto comparando-se os valores das diferenças de deviances das amostras bootstrap com a diferença de deviances inicial. Os resíduos utilizados são os resíduos simples, de Pearson e de Pearson padronizados. A aplicação da técnica é realizada através de dois conjuntos de dados de experimentos agronômicos, em que, no primeiro, a variável resposta foi o tempo até a murcha de um cultivar de linho susceptível ao patógeno Fusarium oxysporum e, no segundo, a variável resposta é o tempo até o inseto Podysus nigrispinus atingir a fase adulta. O método bootstrap indicou evidência de que o modelo logístico é o mais adequado para ajustar os dados do experimento com linho. Já no caso do experimento com insetos, o método indicou o modelo de Cox como o mais adequado aos dados e o resíduo de Pearson e Pearson padronizado, em ambos os casos, foram os que forneceram uma maior indicação para a escolha dos modelos em questão.
Title in English
The utilization of the bootstrap method to choose between the cox and the logistic models for interval-censored data
Abstract in English
ln many scientific works, researchers are interested in identifying variables or factors that influence the time of occurrence of certain events, which is generally known as failure time. However, it's not always possible to observe the exact failure time knowing only the interval in which failure occurred. Such data are known as grouped data or interval-censored data and present tied observations. When the number of ties is small, analysis of such data can be made by fitting the Cox Model (Cox, 1972) considering approximations for partial likelihood. ln case there are many ties, the time must be considered as discreet and the probability of occurrence of the event must be modeled in a certain interval, since it did not take place in the immediately preceding interval. This can be done by considering the response variable as a binary variable that indicates failure and by fitting the Cox model for grouped data or the logistic model through generalized linear models with complementary log-log and logit link functions, respectively. After fitting the models, it is necessary to decide which of them is more adequate for the experimental data. To that end, some model selection techniques are available in the literature, such as the Akaike lnformation Criterion (Akaike, 1973) and the Score Tests proposed by Colosimo et al. (2000), among others. This work proposes a new methodology to select between the Cox and logistic models for interval-censored data using the bootstrap method for the residues. This is done by extracting the residues from the fit of the proposed models and by calculating the deviance difference between the fitted models. After that, new observations are recomposed from the bootstrap residues and new deviance differences are calculated. A histogram for such values is then obtained and an empirical significance level is proposed by comparing the differences deviance values in the bootstrap samples with the deviance difference in the initial fit. The residues used are the simple residues, Pearson and standardized Pearson residues. The application of the technique was conducted through two data sets concerning agronomic experiments, in the first of which the response variable was the time until the blight of a flax cultivar susceptible to the pathogen Fusarium oxysporum and, in the second, the response variable was the time until the insect Podysus nigrispinus reached its adult phase. The bootstrap method indicated the evidence that the logistic model is more adequate to fit data for the experiment concerning flax. However, in the experiment concerning insects, the method indicated the Cox model as more adequate for the data, and the Pearson and standardized Pearson residue, in both cases, provided a greater indication for the choice of the considered models.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-01-11
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.