• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Mémoire de Maîtrise
DOI
Document
Auteur
Nom complet
Vinicius Daguano Gastaldi
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2019
Directeur
Jury
Brentani, Helena Paula (Président)
Carazzolle, Marcelo Falsarella
Hoexter, Marcelo Queiroz
Nakaya, Helder Takashi Imoto
Titre en portugais
Análise composicional de sequenciamento completo do exoma de probandos do transtorno do espectro autista
Mots-clés en portugais
Análise por conglomerados
Biologia computacional
Genética
Psiquiatria
Sequenciamento completo do exoma
Transtorno do espectro autista
Resumé en portugais
O sequenciamento completo do exoma (SCE) cobre a porção codificadora de proteínas do genoma, a qual representa apenas 1% do mesmo, mas que estima-se conter 85% das mutações causadoras de doenças em distúrbios mendelianos. Nos últimos anos, o SCE tem contribuído para melhor caracterizar a complexa arquitetura genética de alguns distúrbios do neurodesenvolvimento através da detecção de variantes raras, ajudando a descrever as características da variação genética que contribuem para a variabilidade fenotípica hereditária. Neste estudo, hipotetizamos que uma composição de variantes raras poderia agrupar probandos com Transtorno do Espectro Autista (TEA) refletindo sua variabilidade fenotípica, incluindo o QI (quoeficiente de inteligência) e outras medidas relacionadas ao TEA. Para testar essa hipótese, usamos análise composicional em conjunto com análise de agrupamentos hierárquica para estratificar probandos através dos seguintes tipos de variantes: de novo missense, de novo Likely Gene Disrupting (LGD - provavelmente gene disruptivas), missense herdada e LGD herdada. Utilizamos como amostra um conjunto de dados de 2313 probandos com TEA provenientes da Simons Simplex Collection, um dos projetos principais da Iniciativa de Pesquisa em Autismo da Fundação Simons. A análise composicional acoplada a inferência bayesiana tradicional com uma priori bimodal resultou em seis agrupamentos onde o principal fator de agrupamento foi a falta de tipos de variação, mas sem diferença estatisticamente significativa no QI entre os agrupamentos. Uma comparação da distribuição cumulativa dos escores dos fenótipos usando um teste Kolmogorov-Smirnov de dois lados de amostra única revelou diferenças significativas para quatro agrupamentos em várias subescalas das escalas ABC, ADI-R, CBCL e Vineland II. Esses resultados indicam que ter uma proporção maior das variações mais prejudiciais não se correlaciona diretamente com os piores fenótipos. A presença ou ausência de tipos de variação não explica os fenótipos, o que pode indicar que o achatamento de dados resultante da abordagem bimodal pode esconder relações importantes entre composição e fenótipos. Por essa razão, usamos uma segunda abordagem com a adição de uma priori uniforme antes da análise composicional. Os 29 agrupamentos estratificados nessa abordagem apresentaram uma visão composicional mais fina e com maior variabilidade. Observamos que indivíduos com de novo LGD e de novo missense apresentam tendência de QI mais baixo, contudo, a associação entre a composição de variantes e o QI não é direta. Isso também foi observado na comparação da distribuição cumulativa dos escores fenotípicos. Existem diferenças significativas para todas as escalas e para 88% das subescalas para a maior parte dos agrupamentos, no entanto, isto não é suficiente para identificar uma associação clara entre composição e fenótipos. Nossos resultados mostram que a análise composicional dos dados de SCE é capaz de estratificar aglomerados estáveis de probandos com TEA com diferentes composições de variantes e de fenótipos. Concluímos que a análise composicional estratificou agrupamentos promissores quanto à relação composição-fenótipo e, ao aprimorar essa abordagem, pode ser possível entender melhor a arquitetura genética do TEA e de outras doenças complexas
Titre en anglais
Compositional analysis of whole-exome sequencing data of autism spectrum disorder probands
Mots-clés en anglais
Autism spectrum disorder
Cluster analysis
Computational biology
Genetics
Psychiatry
Whole exome sequencing
Resumé en anglais
Whole-exome sequencing (WES) covers the protein coding portion of the genome, which accounts for only 1% of its length, but is estimated to contain 85% of the disease-causing mutations in Mendelian disorders. In recent years, WES has been contributing to better characterize the complex genetic architecture of some neurodevelopmental disorders through the detection of rare variants, helping to describe the characteristics of genetic variation that contribute to heritable phenotypic variability. In this study, we hypothesized that a composition of rare variants could group Autism Spectrum Disorder (ASD) probands reflecting their phenotypic variability, including IQ (intelligence quotient) and other ASD related measurements. To test this hypothesis, we used compositional analysis and hierarchical clustering to stratify probands using the following variant types: de novo missense, de novo Likely Gene Disrupting (LGD), inherited missense, and inherited LGD. Our sample consisted of a dataset containing WES and phenotype data from over 2300 ASD probands from the Simons Simplex Collection, a core project and source of the Simons Foundation Autism Research Initiative. Compositional analysis coupled to traditional Bayesian inference with a bimodal prior resulted in six clusters where the main grouping factor was the lack of variation types, but with no statistically significant difference in IQ between the clusters. A comparison of the cumulative distribution of the scores of the phenotypes using a one-sample two-sided Kolmogorov-Smirnov test revealed significant differences for four clusters in a number of subscales of the ABC, ADI-R, CBCL and Vineland II scales. These results indicate that having a higher proportion of the most damaging variations does not directly correlates to having the worst phenotypes. The presence or absence of types of variation does not explain the phenotypes, what might indicate that the data flattening resulting from the bimodal approach might hide important relationships between composition and phenotypes. For this reason, we used a second approach with the addition of a uniform prior before the compositional analysis. The 29 stratified clusters in this approach had a finer compositional view with more variability. We observed that individuals with de novo LGD and de novo missense tend to have lower IQ, however, the variant composition and IQ association is not straightforward. This was also observed in the comparison of cumulative distribution of phenotype scores. Even though there are significant differences for all scales and 88% of the subscales for a majority of the clusters, they were not sufficient to identify a clear association between composition and phenotypes. Our results show that compositional analysis of WES data is able to stratify stable clusters of ASD probands with different variant compositions and phenotypes. We conclude that the compositional analysis produced promising clusters regarding composition-phenotypes relationship and, by improving this approach, it may be possible to better understand the architecture of ASD and of other complex diseases
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2019-11-11
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2020. Tous droits réservés.