Implementação Paralela de Núcleos Computacionais do Solver Orthomin

Autores/as

  • João Paulo P. K. Zanardi
  • Ítalo C. L. Nievinski
  • Luiz Mariano Carvalho

DOI:

https://doi.org/10.5540/03.2018.006.01.0379

Resumen

Apresentamos uma implementação paralela eficiente em memória compartilhada de alguns núcleos computacionais do solver Orthomin. Os núcleos apresentados são o produto matriz vetor e o processo de ortogonalização de Gram-Schmidt. As implementações foram feitas em C++ utilizando diretivas OpenMP para a paralelização. Além disso, as implementações foram feitas visando as arquiteturas Intel Xeon e os aceleradores Intel Xeon Phi.

Descargas

Los datos de descargas todavía no están disponibles.

Publicado

2018-02-14

Número

Sección

Trabalhos Completos