• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.11.2020.tde-20200111-131551
Document
Author
Full name
Luciana Aparecida Carlini-Garcia
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
Piracicaba, 2001
Supervisor
Title in Portuguese
Uso do método de reamostragem Bootstrap na estimação de parâmetros genéticos populacionais
Keywords in Portuguese
GENÉTICA DE POPULAÇÕES
PARÂMETROS
REAMOSTRAGEM BOOTSTRAP
Abstract in Portuguese
Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes níveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivíduos, populações, e indivíduos e populações concomitantemente. Para os parâmetros índice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), índice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possível obter, em função das diferentes fontes de reamostragem, os erros associados às estimativas desses parâmetros, a distribuição empírica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas às estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empíricas de e ; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivíduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivíduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possível concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivíduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivíduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos níveis dos fatores locos, indivíduos e populações, foram estimadas as respectivas variâncias e construídas curvas de regressão entre o número de populações, ou indivíduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variação
Title in English
Use of Bootstrap in the estimation of population genetic parameters
Abstract in English
Genetic structure and mating system of natural populations have often been studied using molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose. There is little information about errors associated with these estimates due to different possible sampling leveis. The knowledge of this information could be used to minimize the magnitude of the errors associated with such estimates. Real and simulated datasets were used in this study. With the real datasets, bootstrapping over loci, individuals, populations and both individuals and populations simultaneously, was performed. These different resampling strategies produced errors of the estimates, empiric probability distributions and confidence intervals for the following parameters: total fixation index (F ), diversity among populations or coancestry index (θ ), fixation index within populations (ƒ ), apparent outcrossing rates (ta), gene flow between populations (Nm), and effective population size (Ne ). Generally, smaller variances were associated with estimates of θ , whereas the largest were associated with , ̂, and N̂m. The only estimates approaching normality were F, ƒ, when individuals were involved in the resampling process. This was probably caused by the larger number of individuals comparison with the number of loci and populations commonly used. Resampling both simulated and real datasets for estimation of , ƒ and θ jointly and separately showed that the variances due to individuals and due to populations are additive. Consequently, it is possible to calculate the relative contribution of these two sources of variation to the total variance of the estimates. There was overall agreement between results chained when two different methods were applied to assess the relative importance of individuals and populations as source of errors in the estimation of F , ƒ and θ. Bootstrap samples of variable sizes were used to determine the number of loci, individuals and populations necessary to achieve a given precision in the estimates of F, ƒ and θ. Variance estimates with different numbers of loci, individuals and population were obtained and regression analyses performed relating these estimates with the corresponding number of populations, individuals on loci. The magnitude of errors of the estimates in most real datasets indicated that sample sizes currently used in research involving natural populations would be suitable only for the estimation of θ. The largest errors of the estimates of F and ƒ were associated with sampling error due to loci. Therefore, future studies should use a larger number of loci to improve the estimation of these parameters. Sampling error due to populations was also important and should not be neglected for the estimation of F and ƒ. This study reinforced the importance of bootstrapping as a technique to measure precision of population parameter estimates under different sources of variation
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2020-01-11
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2021. All rights reserved.