• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.55.2024.tde-12072024-113349
Documento
Autor
Nombre completo
Khennedy Bacule dos Santos
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2024
Director
Tribunal
Cúri, Mariana (Presidente)
Cancho, Vicente Garibay
Rodrigues, Francisco Aparecido
Trinca, Luzia Aparecida
Título en portugués
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama
Palabras clave en portugués
Análise da sobrevida
Expressão gênica
Modelo de Cox
Redução de dimensionalidade
Resumen en portugués
Milhares de pessoas sofrem com o câncer, tornando-a uma das doenças que mais matam pessoas ao redor do mundo. Esta doença se carateriza por modificações na estrutura do DNA, o que impacta na produção descontrolada das células. Neste estudo abordamos uma predição da sobrevida para pacientes com câncer de mama nos estágios I, II e III, levando em consideração informações clinicas e genéticas. Para isto, o método de Cox, uma regressão capaz de estimar a função de risco, é usada para predizer a sobrevida dos pacientes. Devido a alta dimensionalidade da informação genética e as limitações do modelo Cox, são abordados métodos para a redução dos dados. Abordamos três maneiras para a redução de dimensionalidade, consistindo na penalização lasso na regressão de Cox, seleção por similaridade na expressão genética, com o algoritmo de agrupamento K-means, e a redução da dimensionalidade por meio da rede neural AutoEncoder, baseado nos grupos de similaridade. A partir dos experimentos, constatamos que a informação genética colabora para a criação de melhores preditores, em que as três abordagens de redução da dimensionalidade, apresentaram um melhor C-index, quando comparado ao método abordando apenas informações clinicas. Ao decorrer desta pesquisa, também verificamos que o material genético, além de aumentar o risco da sobrevida em alguns casos, há ocorrência do efeito de proteção. Ao final, propomos baseado nos resultados obtidos, uma possível evolução para a criação de um método capaz de otimizar o erro na predição da sobrevida, interpretar suas decisões e lidar com a alta dimensionalidade dos dados.
Título en inglés
Gene selection for predicting survival in breast cancer patients
Palabras clave en inglés
Cox model
Dimensionality reduction
Gene expression
Survival analysis
Resumen en inglés
Thousands of people suffer from cancer, making it one of the most deadly diseases worldwide. This disease is characterized by changes in the DNA structure, which impacts the uncontrolled production of cells. In this study, we approach a survival prediction for patients with breast cancer in stages I, II, and III, considering clinical and genetic information. For this, the Cox method, a regression capable of estimating the risk function, is used to predict patient survival. Due to the high dimensionality of the genetic information and the limitations of the Cox model, methods for data reduction are used. We approach three ways to reduce dimensionality: lasso penalty in Cox regression, selection for similarity in gene expression with the K-means clustering algorithm, and dimensionality reduction through the AutoEncoder neural network. From the experiments, we found that genetic information contributes to the creation of better predictors. The three approaches to dimensionality reduction presented a better C-index when compared to the method that addressed only clinical information. In the course of this research, we verified that the genetic material increases the risk of survival in some cases, but we found it also has a protective effect. Finally, based on the results, we propose a possible evolution towards creating a method capable of optimizing the error in survival prediction, interpreting their decisions, and dealing with the high dimensionality of the data.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2024-07-12
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.