Implementação Paralela de Núcleos Computacionais do Solver Orthomin

Authors

  • João Paulo P. K. Zanardi
  • Ítalo C. L. Nievinski
  • Luiz Mariano Carvalho

DOI:

https://doi.org/10.5540/03.2018.006.01.0379

Abstract

Apresentamos uma implementação paralela eficiente em memória compartilhada de alguns núcleos computacionais do solver Orthomin. Os núcleos apresentados são o produto matriz vetor e o processo de ortogonalização de Gram-Schmidt. As implementações foram feitas em C++ utilizando diretivas OpenMP para a paralelização. Além disso, as implementações foram feitas visando as arquiteturas Intel Xeon e os aceleradores Intel Xeon Phi.

Downloads

Download data is not yet available.

Published

2018-02-14

Issue

Section

Trabalhos Completos