• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2016.tde-20230727-113441
Documento
Autor
Nome completo
Nils Urmersbach
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2016
Orientador
Título em português
A Classic Linear System Solver on Modern Hardware Architecture for Sparse Systems
Palavras-chave em português
Métodos Numéricos
Sistemas Lineares
Resumo em português
Nesse trabalho apresentamos as nossas implementações do Método de Jacobi para sistemas lineares esparsos gerais no formato de Compressed Sparse Row (CSR) usando OpenMP, OpenACC e CUDA. Aplicamos essas implementações no sistema linear derivado da discretização de diferenças finitas centrais da Equação de Poisson em duas dimensões em domínios retangulares e comparamos o desempenho das implementações de CSR com o desempenho de um solver direto da Equação de Poisson usando o estêncil de cinco pontos. Para nosso estudo de caso nós consideramos cinco tamanhos diferentes de malhas (com até 223C67.1 milhões desconhecidos), ambos precisão simples e dupla, e uma variedade de números de threads para a implementação de OpenMP, resultando em 300 configurações diferentes executadas para esse trabalho. Nós discutimos o comportamento de escalagem das implementações diferentes e apresentamos alguns resultados de perfilamento dos nossos programas paralelizados.
Título em inglês
Um solver de sistemas lineares clássico na arquitetura moderna de hardware para sistemas esparsos
Resumo em inglês
In this work we present our implementations for the Jacobi Method for general sparse linear systems in the Compressed Sparse Row (CSR) format using OpenMP, OpenACC and CUDA. We apply these implementations to the linear system derived from the central finite difference discretization of the two- dimensional Poisson Equation on rectangular domains, and compare the performance of the CSR imple- mentations to the performance of a direct Poisson Equation solver using the five-point stencil. For our case study, we consider five different grid size (with up to 223C67.1 million unknowns), both in single precision and double precision, and a variety of thread numbers for the OpenMP implementation, resulting in 300 different configurations in total that were executed for this work. We discuss the scaling behaviour of the different implementations and present some profiling results of our parallelized programs.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
UrmersbachNils.pdf (2.11 Mbytes)
Data de Publicação
2023-07-27
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.