• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
10.11606/T.95.2013.tde-09022014-090547
Document
Author
Full name
José Osório de Oliveira Azevedo Neto
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2013
Supervisor
Committee
Matioli, Sergio Russo (President)
Brentani, Helena Paula
Ojopi, Elida Paula Benquique
Otto, Paulo Alberto
Pereira, Carlos Alberto de Braganca
Title in Portuguese
Troost - Busca de interações entre trios de SNPs em estudos de associação de genoma inteiro
Keywords in Portuguese
diabetes
doenças genéticas
epistasia
Estudos de associação
GWAS
interação genéticas
marcadores
SNP
Abstract in Portuguese
Os estudos de associação de genoma inteiro têm encontrado alguns marcadores associados a doenças notoriamente hereditárias com herança complexa, mas, muitas vezes, estes marcadores somente explicam uma pequena parte da herdabilidade. Este relativo insucesso é atribuído, entre outras causas, à epistasia, ou seja, interação entre diferentes locos genéticos. A busca por epistasia é complexa e exige intensos recursos computacionais. Diversos métodos têm sido propostos para abordar este problema, incluindo métodos estatísticos tradicionais, busca estocástica e métodos heurísticos. Poucos destes métodos são capazes de processar as grandes massas de dados produzidas nos estudos caso-controle de genoma inteiro, e ainda menos métodos buscam conjuntos de três ou mais marcadores. A busca exaustiva de conjuntos de marcadores epistáticos é inviável hoje em dia para estes conjuntos, mas o algoritmo BOOST (WAN et al., 2010) mostrou que ela é relativamente fácil para pares de locos, em especial com o uso de placas gráficas como processadores (GPGPU). Partindo deste recente sucesso, propomos um algoritmo em fases para a busca de trios de locos que interagem, utilizando a busca de pares como passo inicial, uma abordagem ainda não utilizada. Outra ideia fundamental do algoritmo proposto é a extensão da concepção de trio de marcadores para um trio de blocos haplotípicos, onde cada bloco é formado por marcadores próximos entre si. Usando os dados do WTCCC, o Troost (de TRio+bOOST) sugeriu trios potencialmente epistáticos em todas a sete doenças. Quando submetidos à confirmação em amostra independente, os trios não puderam ser confirmados, exceto os trios para diabetes tipo 1 (T1D). Duzentos e oito trios foram confirmados para T1D, com baixos valores-P e genótipos combinados de risco com altas razões de chances. Os SNPs que compõem estes trios estão todos na região MHC, sabidamente associada à doença, exceto por um deles que está no cromossomo cinco e não havia sido previamente relacionado à T1D.
Title in English
Troost Search for interactions among trios of SNPs in genome-wide association studies
Keywords in English
association studies
diabetes
epistasis
genetic diseases
genetic interaction
GWAS
markers
SNP
trio
Abstract in English
Genome-wide association studies have found some markers associated with diseases with complex inheritance. However, these markers explain only a fraction of the previously estimated heritability of the trait. This relative failure has been credited, among other causes, to epistasis, i.e. the interaction among genotypes at different loci. The search for epistasis is complex and requires intense computational resources. Many methods have been proposed to approach this problem, including traditional statistics, stochastic search, and heuristic methods. Few of them are capable of extracting, from the large amount of data produced in genome-wide case-control studies, useful information about sets of markers associated with the trait in question. Exhaustive search of sets of interacting markers is unfeasible nowadays for sets of three or more markers, but the BOOST algorithm (WAN et al., 2010) showed that the search is relatively easy for pairs of SNPs, in particular with the use of graphic cards for general processing (GPGPU). Starting from this recent success, we propose an algorithm in phases for the search for trios of interacting loci, using the search for pairs as the initial step, an approach not tried yet, to our knowledge. Another important idea of our algorithm is the extension of the concept of trio of markers to a trio of haplotypic blocks, where each block is formed by neighbor markers. Using data from WTCCC, the Troost (from TRio+bOOST) algorithm suggested potentially epistatic trios in all seven diseases. When submitted to a confirmation in an independent sample, the results could not be confirmed, except for type-1 diabetes (T1D). Two hundred eight trios were confirmed for T1D, with low p-values and risk combined genotypes with high odds ratio. The SNPs that form those trios are all in the MHC region, which is known to be strongly associated to T1D, except by one SNP in chromosome five that has not been previously associated with T1D.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
troost.pdf (3.53 Mbytes)
Publishing Date
2014-02-17
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
Centro de Informática de São Carlos
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2020. All rights reserved.