• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.95.2022.tde-29112022-121409
Document
Author
Full name
Camila Alves de Souza
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2022
Supervisor
Committee
Soler, Julia Maria Pavan (President)
Carvalho, Benilton de Sá
Pinheiro, Hildete Prisco
Rogero, Marcelo Macedo
Title in Portuguese
Mapeamento e estudo de associação de Variações no Número de Cópias de DNA (CNVs) e de Regiões com Perda de Heterozigozidade (LOH) com fenótipos complexos
Keywords in Portuguese
Ancestralidade
Copy number variation
Loss of heterozygosity
Abstract in Portuguese
Com o avanço das tecnologias citogenômicas, tornou-se possível a detecção confiável de diversas alterações genômicas e a determinação da ancestralidade dos indivíduos, uma importante ferramenta de entendimento da origem e da história das populações, bem como, fonte de decisões no contexto de saúde pública. Dentre os diferentes tipos de variação genética, existem as Copy Number Variation (CNV) que são ganhos ou perdas de segmentos de DNA. Diversos trabalhos associam as CNVs a diferentes tipos de fenótipos envolvidos com doenças monogênicas bem como multifatoriais. Outra variação genética importante é a Loss of heterozygosity (LOH), uma instabilidade cromossômica caracterizada pelo desequilíbrio alélico, onde uma região genômica heterozigota se torna homozigota através da perda de um dos alelos. As regiões homozigotas podem representar populações, determinar nível de consanguinidade e diversos estudos correlacionam as regiões LOH como uma das principais causas de tumorigênese. Neste trabalho, tendo em vista a importância da determinação da ancestralidade dos indivíduos e do impacto das variantes CNV e das LOHs ao contexto da saúde humana, o objetivo é construir bancos de dados de ancestralidade, CNVs e LOH a partir dos dados do projeto ISA-Nutrição, genotipados através da plataforma Axiom 2.0 (Affymetrix, Thermo Fisher). Tal informação permitirá correlacionar variações moleculares a fenótipos que sejam relevantes ao grupo de estudo, contribuindo assim para o melhor entendimento do perfil do brasileiro. O processamento dos dados envolvido neste trabalho não é tarefa simples pois exige a execução de diferentes pipelines que utilizam diferentes softwares como PLINK, além de softwares proprietários disponibilizados pela Affymetrix e bibliotecas das linguagens R e Python. Neste sentido, uma contribuição do presente trabalho é propor um pipeline customizado para análise de ancestralidade e identificação de regiões de CNV e de LOH a partir de dados de SNParray. Resultados: Como esperado, a amostra ISA-Nutrição permitiu caracterizar a alta miscigenação da população brasileira e alguns indivíduos apresentaram diferenças entre a raça autodeclarada e as proporções ancestrais das populações em comparação com o projeto 1000 genomas. Foram detectadas 34.824 CNVs para as 841 amostras do estudo, variando entre 49.3kb (CN=0) a 33.5Mb (CN=3). As LOHs tiveram média de 1,5% nos cromossomos autossômicos, foram detectadas 26.558 nas 841 amostras e variaram entre 1Mb e 108Mb.
Title in English
Mapping and study of association of DNA Copy Number Variations (CNVs) and Loss of Heterozygosity Regions (LOH) with complex phenotypes
Keywords in English
Ancestry
Copy number variation
Loss of heterozygosity
Abstract in English
With the advancement of cytogenomic technologies, it became possible to reliably detect several genomic alterations and determine the ancestry of individuals, an important tool for understanding the origin and history of populations, as well as a source of decisions in the context of public health. Among the different types of genetic variation, there are Copy Number Variation (CNV) which are gains or losses of DNA segments. Several studies associate CNVs with different types of phenotypes involved with monogenic as well as multifactorial diseases. Another important genetic variation is Loss of heterozygosity (LOH), a chromosomal instability characterized by allelic imbalance, where a heterozygous genomic region becomes homozygous through the loss of one of the alleles. Homozygous regions can represent populations, determine level of consanguinity, and several studies have correlated LOH regions as one of the main causes of tumorigenesis. In this work, in view of the importance of determining the ancestry of individuals and the impact of CNV and LOH variants in the context of human health, the objective is to build ancestry databases, CNVs and LOH from data from the ISA- Nutrition, genotyped using the Axiom 2.0 platform (Affymetrix, Thermo Fisher). Such information will allow the correlation of molecular variations to phenotypes that are relevant to the study group, thus contributing to a better understanding of the Brazilian profile. The data processing involved in this work is not a simple task as it requires the execution of different pipelines that use different software such as PLINK, and proprietary software provided by Affymetrix and R and Python language libraries. In this sense, a contribution of the present work is to propose a customized pipeline for ancestry analysis and identification of CNV and LOH regions from SNParray data. Results: As expected, ISA-Nutrition data showed the high miscegenation of the Brazilian population, and some individuals show differences between selfreported race and ancestral proportions of populations compared to the 1000genomas project. In total 34,824 CNVs were detected for the 841 samples of the study, ranging from 49.3kb (CN=0) to 33.5Mb (CN=3). The LOHs had an average of 1.5% in the autosomal chromosomes, 26,558 were detected in the 841 samples, and ranged from 1Mb to 108Mb.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2022-12-12
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.