Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores
Este artículo demuestra por primera vez que el uso directo de núcleos tensoriales FP64 en GPUs NVIDIA, combinado con optimizaciones de fusión de kernels en la biblioteca MFEM, acelera significativamente las simulaciones de elementos finitos de alto orden a escala exascale, logrando mejoras de rendimiento de hasta 2 veces y una eficiencia energética del 83% en sistemas como Alps.