Implementação Paralela de Núcleos Computacionais do Solver Orthomin

Autores

  • João Paulo P. K. Zanardi
  • Ítalo C. L. Nievinski
  • Luiz Mariano Carvalho

DOI:

https://doi.org/10.5540/03.2018.006.01.0379

Resumo

Apresentamos uma implementação paralela eficiente em memória compartilhada de alguns núcleos computacionais do solver Orthomin. Os núcleos apresentados são o produto matriz vetor e o processo de ortogonalização de Gram-Schmidt. As implementações foram feitas em C++ utilizando diretivas OpenMP para a paralelização. Além disso, as implementações foram feitas visando as arquiteturas Intel Xeon e os aceleradores Intel Xeon Phi.

Downloads

Não há dados estatísticos.

Downloads

Publicado

2018-02-14

Edição

Seção

Trabalhos Completos