• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
https://doi.org/10.11606/D.55.2024.tde-12072024-113349
Document
Auteur
Nom complet
Khennedy Bacule dos Santos
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Carlos, 2024
Directeur
Jury
Cúri, Mariana (Président)
Cancho, Vicente Garibay
Rodrigues, Francisco Aparecido
Trinca, Luzia Aparecida
Titre en portugais
Seleção de genes para a predição da sobrevida em pacientes com câncer de mama
Mots-clés en portugais
Análise da sobrevida
Expressão gênica
Modelo de Cox
Redução de dimensionalidade
Resumé en portugais
Milhares de pessoas sofrem com o câncer, tornando-a uma das doenças que mais matam pessoas ao redor do mundo. Esta doença se carateriza por modificações na estrutura do DNA, o que impacta na produção descontrolada das células. Neste estudo abordamos uma predição da sobrevida para pacientes com câncer de mama nos estágios I, II e III, levando em consideração informações clinicas e genéticas. Para isto, o método de Cox, uma regressão capaz de estimar a função de risco, é usada para predizer a sobrevida dos pacientes. Devido a alta dimensionalidade da informação genética e as limitações do modelo Cox, são abordados métodos para a redução dos dados. Abordamos três maneiras para a redução de dimensionalidade, consistindo na penalização lasso na regressão de Cox, seleção por similaridade na expressão genética, com o algoritmo de agrupamento K-means, e a redução da dimensionalidade por meio da rede neural AutoEncoder, baseado nos grupos de similaridade. A partir dos experimentos, constatamos que a informação genética colabora para a criação de melhores preditores, em que as três abordagens de redução da dimensionalidade, apresentaram um melhor C-index, quando comparado ao método abordando apenas informações clinicas. Ao decorrer desta pesquisa, também verificamos que o material genético, além de aumentar o risco da sobrevida em alguns casos, há ocorrência do efeito de proteção. Ao final, propomos baseado nos resultados obtidos, uma possível evolução para a criação de um método capaz de otimizar o erro na predição da sobrevida, interpretar suas decisões e lidar com a alta dimensionalidade dos dados.
Titre en anglais
Gene selection for predicting survival in breast cancer patients
Mots-clés en anglais
Cox model
Dimensionality reduction
Gene expression
Survival analysis
Resumé en anglais
Thousands of people suffer from cancer, making it one of the most deadly diseases worldwide. This disease is characterized by changes in the DNA structure, which impacts the uncontrolled production of cells. In this study, we approach a survival prediction for patients with breast cancer in stages I, II, and III, considering clinical and genetic information. For this, the Cox method, a regression capable of estimating the risk function, is used to predict patient survival. Due to the high dimensionality of the genetic information and the limitations of the Cox model, methods for data reduction are used. We approach three ways to reduce dimensionality: lasso penalty in Cox regression, selection for similarity in gene expression with the K-means clustering algorithm, and dimensionality reduction through the AutoEncoder neural network. From the experiments, we found that genetic information contributes to the creation of better predictors. The three approaches to dimensionality reduction presented a better C-index when compared to the method that addressed only clinical information. In the course of this research, we verified that the genetic material increases the risk of survival in some cases, but we found it also has a protective effect. Finally, based on the results, we propose a possible evolution towards creating a method capable of optimizing the error in survival prediction, interpreting their decisions, and dealing with the high dimensionality of the data.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2024-07-12
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.