• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.17.2024.tde-13052024-144922
Document
Author
Full name
Maria Luisa de Barros Rodrigues
Institute/School/College
Knowledge Area
Date of Defense
Published
Ribeirão Preto, 2024
Supervisor
Committee
Simões, Aguinaldo Luiz (President)
Anacleto, Fernando Bonifacio
Mingroni Netto, Regina Celia
Nunes, Francis de Morais Franco
Title in Portuguese
Seleção de microhaplótipos em larga escala para inferência de ancestralidade na população brasileira
Keywords in Portuguese
Ancestralidade
Informatividade
Microarray
Microhaplótipos
Nativo americanos
População brasileira
Abstract in Portuguese
Os microhaplótipos (MHs) são blocos de 2 ou mais SNPs presentes em um segmento de DNA de tamanho entre 200 e 300 pb. O interesse crescente no uso de MHs é devido à presença de alelos múltiplos, que resulta em maior informatividade que os SNPs individualmente, e menor taxa de mutação que os STRs. Portanto, MHs tornam as estimativas da genética de populações, forense e clínica mais precisas. Visando estimar a ancestralidade da população brasileira pela primeira vez a partir de MHs, elaboramos um pipeline e desenvolvemos um script para seleção de MHs altamente informativos em larga escala, a partir de dados genômicos. Partimos de um dataset incluindo 522 indivíduos do Sudeste do Brasil, mesclados aos dados dos bancos públicos (SGDP, HGDP e 1000 Genome Project), totalizando 4081 indivíduos genotipados em quase 1 milhão de SNPs a partir dos quais selecionamos um conjunto de mais de 120 mil MHs, amplamente distribuídos entre os 22 cromossomos autossômicos. Os marcadores, tanto MHs quanto SNPs, tiveram sua informatividade estimada e foram separados em subconjuntos de marcadores mais informativos para serem utilizados nas estimativas de ancestralidade. Os resultados foram comparados entre si e às estimativas referentes ao conjunto completo de marcadores demonstrando maior eficiência dos MHs para essa finalidade e maior proximidade de resultados dos subconjuntos de MHs em relação ao conjunto completo. Desenvolvemos também uma abordagem para estimar o que chamamos de informatividade cluster específica, no caso informatividade nativa americana, demonstrando maior acurácia na estimativa da proporção de ancestralidade desse grupo sub-representado em bancos de dados públicos.
Title in English
Large-scale selection of microhaplotype for ancestry inference in the Brazilian population
Keywords in English
Ancestry
Brazilian population
Informativeness
Microarray
Microhaplotypes
Native Americans
Abstract in English
Microhaplotypes (MHs) are blocks of 2 or more SNPs present in a DNA segment of up to 300 bp. The growing interest in the use of MHs is due to the presence of multiple alleles, which results in higher informativeness than individual SNPs, and lower mutation rate than STRs. Therefore, MHs make estimates of population, forensic, and clinical genetics more accurate. To estimate the ancestry of the Brazilian population for the first time from MHs, we developed a pipeline and developed a script for the selection of highly informative MHs on a large scale, based on genomic data. We started from a dataset including 522 individuals from the Southeast of Brazil, merged with data from public databases (SGDP, HGDP and 1000 Genome Project), totaling 4081 individuals genotyped in almost 1 million SNPs from which we selected a set of more than 120 thousand MHs, widely distributed among the 22 autosomal chromosomes. The markers, both MHs and SNPs, had their informativeness estimated and were separated into subsets of the most informative markers to be used in ancestry estimates. The results were compared with each other and with the estimates for the complete set of markers, demonstrating greater efficiency of MHs for this purpose and greater proximity of results of MH subsets in relation to the complete set. We also developed an approach to estimate what we call specific cluster informativity, in this case Native American informativeness, demonstrating greater accuracy in estimating the proportion of ancestry of this underrepresented group in public databases.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
There are withheld file due to requirements (data publishing, patents or rights).
Release Date
2026-02-28
Publishing Date
2024-06-24
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.