Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Questo articolo presenta la prima applicazione diretta dei tensor core FP64 su GPU NVIDIA per accelerare simulazioni agli elementi finiti di alto ordine, ottenendo significativi miglioramenti nelle prestazioni e nell'efficienza energetica su larga scala e integrandoli nella libreria MFEM per applicazioni critiche come la previsione di tsunami in tempo reale.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Questo articolo presenta un'architettura completamente residente su GPU e priva di blocchi che, migrando l'intera pipeline di generazione dei segmenti sul dispositivo e introducendo un pool di lavoro asincrono, verifica la congettura di Goldbach fino a $10^{13}$ in 133,5 secondi su un cluster di quattro GPU, ottenendo un'accelerazione di 45,6 volte rispetto alle soluzioni precedenti.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

Il paper presenta Threadle, un motore di archiviazione e query di rete open-source scritto in C# che risolve il problema della gestione su larga scala di reti multistrato e miste (inclusi dati bipartiti) mediante un approccio di proiezione pseudo che evita la materializzazione in memoria, consentendo di memorizzare reti con milioni di nodi e trilioni di collegamenti in pochi gigabyte di RAM.

Carl Nordlund, Yukun Jiao2026-03-06💻 cs