Implementação Paralela de Núcleos Computacionais do Solver Orthomin
DOI:
https://doi.org/10.5540/03.2018.006.01.0379Resumo
Apresentamos uma implementação paralela eficiente em memória compartilhada de alguns núcleos computacionais do solver Orthomin. Os núcleos apresentados são o produto matriz vetor e o processo de ortogonalização de Gram-Schmidt. As implementações foram feitas em C++ utilizando diretivas OpenMP para a paralelização. Além disso, as implementações foram feitas visando as arquiteturas Intel Xeon e os aceleradores Intel Xeon Phi.
Downloads
Não há dados estatísticos.