Dissertação de Mestrado

Documento
Dissertação de Mestrado
Nome completo
Pedro Henrique Gallo Andrade
Unidade da USP
Instituto de Matemática, Estatística e Ciência da Computação
Programa ou Especialidade
Data de Defesa
2026-02-20
Imprenta
São Paulo, 2026
Banca examinadora
Lima, Antonio Carlos Pedroso de (Presidente)
Artes, Rinaldo
Paes, Angela Tavares
Título em português
Comparação de métodos de penalização na qualidade de predições em modelos de análise de sobrevivência
Palavras-chave em português
Análise de sobrevivência, Predição, Técnicas de penalização
Resumo em português
Este trabalho tem como objetivo avaliar o desempenho preditivo de métodos de penalização aplicados à estimação em modelos de sobrevivência, tais como Firth, Lasso e Ridge, com foco em sua aplicabilidade em cenários com amostras pequenas e elevada proporção de censura. O estudo também busca analisar os efeitos dessas técnicas na estimativa dos parâmetros em modelos paramétricos, visando aprimorar a precisão das análises nestes contextos desafiadores. Para isso, são conduzidos experimentos com dados simulados, nos quais os métodos são comparados utilizando métricas como viés, erro quadrático médio, área sob a curva, índice de concordância e escore de Brier para avaliar as estimativas dos parâmetros e a performance preditiva. Além disso, é analisado o desempenho computacional, considerando o tempo de execução e a taxa de convergência dos modelos. Para comparar essas metodologias, além dos estudos de simulação, é realizada uma aplicação prática dessas técnicas em um conjunto de dados de um estudo do Instituto do Coração do Hospital das Clínicas da FMUSP. Os resultados indicam que o método de penalização Firth apresenta os melhores resultados em termos de viés e erro quadrático médio, especialmente com amostras pequenas e alta censura. Contudo, à medida que o tamanho da amostra aumenta, a robustez dos modelos cresce, o que diminui as variações nas estimativas e minimiza as diferenças entre os métodos. A análise também evidencia pontos positivos e negativos para os modelos paramétricos e semi-paramétricos, destacando a importância da correta especificação da distribuição paramétrica. A escolha inadequada da distribuição nos modelos paramétricos compromete a precisão das estimativas, enquanto a ausência de uma função paramétrica para o tempo de falha nos modelos semi-paramétricos limita a previsão de tempos absolutos de sobrevivência. Em termos de desempenho computacional, os modelos ajustados por máxima verossimilhança são os mais rápidos, seguidos pelo método Firth, enquanto os métodos Lasso e Ridge exigem mais tempo devido ao processo de seleção de penalização. Em cenários com alta censura ou limitações amostrais, o método Firth se mostra preferível por sua maior robustez e precisão preditiva.
Título em inglês
Comparison of penalization methods on the quality of predictions in survival analysis models
Palavras-chave em inglês
Penalization techniques, Prediction, Survival analysis
Resumo em inglês
This study aims to evaluate the predictive performance of penalization methods applied to estimation in survival models, such as Firth, Lasso, and Ridge, with a focus on their applicability in scenarios involving small sample sizes and a high proportion of censoring. The study also seeks to analyze the effects of these techniques on parameter estimation in parametric models, with the objective of improving the accuracy of analyses in such challenging contexts. To this end, experiments are conducted using simulated data, in which the methods are compared based on metrics such as bias, mean squared error, area under the curve, concordance index, and Brier score, in order to assess both parameter estimates and predictive performance. In addition, computational performance is evaluated, considering execution time and model convergence rates. To further compare these methodologies, beyond simulation studies, a practical application of these techniques is carried out using a dataset from a study conducted by the Heart Institute (InCor) of the Hospital das Clínicas, University of São Paulo Medical School (FMUSP). The results indicate that the Firth penalization method yields the best performance in terms of bias and mean squared error, particularly in small-sample settings with high censoring. However, as the sample size increases, the robustness of the models improves, reducing variability in the estimates and minimizing differences among the methods. The analysis also highlights both strengths and limitations of parametric and semi-parametric models, emphasizing the importance of correctly specifying the parametric distribution. An inappropriate choice of distribution in parametric models compromises the accuracy of the estimates, whereas the absence of a parametric function for failure time in semi-parametric models limits the prediction of absolute survival times. In terms of computational performance, models fitted via maximum likelihood are the fastest, followed by the Firth method, while Lasso and Ridge methods require more time due to the penalization selection process. In scenarios with high censoring or sample size limitations, the Firth method proves to be preferable due to its greater robustness and predictive accuracy.

AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.

Data de Publicação
2026-04-24

Trabalhos decorrentes

AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.

Serviços

Carregando...