Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Este artículo demuestra por primera vez que el uso directo de núcleos tensoriales FP64 en GPUs NVIDIA, combinado con optimizaciones de fusión de kernels en la biblioteca MFEM, acelera significativamente las simulaciones de elementos finitos de alto orden a escala exascale, logrando mejoras de rendimiento de hasta 2 veces y una eficiencia energética del 83% en sistemas como Alps.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

Numerically stable evaluation of closed-form expressions for eigenvalues of $3 \times 3$ matrices

Este trabajo presenta un método numéricamente estable y aproximadamente diez veces más rápido que las bibliotecas estándar para calcular los autovalores de matrices reales diagonalizables de $3 \times 3$ mediante fórmulas cerradas basadas en cuatro invariantes, superando la inestabilidad de las soluciones trigonométricas tradicionales en casos de autovalores repetidos.

Michal Habera, Andreas Zilian2026-03-06🔢 math

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

Threadle es un motor de almacenamiento y consulta de redes de alto rendimiento y bajo consumo de memoria, escrito en C#, que permite gestionar y analizar a escala redes multicapa y mixtas de millones de nodos mediante una innovación de pseudo-proyección que evita la materialización de proyecciones de dos modos, ofreciendo además interfaces en línea de comandos y para R.

Carl Nordlund, Yukun Jiao2026-03-06💻 cs