cs.MS articles | Gist.Science

Efficient and Flexible Multirate Temporal Adaptivity

Cet article présente de nouveaux contrôleurs d'adaptativité temporelle multirate conçus pour les méthodes d'intégration MRI, qui, combinés à de nouvelles embeddings permettant des méthodes d'ordre 5, offrent une flexibilité et des performances accrues pour la simulation efficace de problèmes à multiples échelles de temps.

Daniel R. Reynolds, Sylvia Amihere, Dashon Mitchell, Vu Thai LuanWed, 11 Ma🔢 math

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

Cet article présente \texttt{EinSum}, une extension de la notation d'Einstein pour les calculs tensoriels relationnels, permettant de réécrire automatiquement les calculs afin d'exécuter les parties intensives via des noyaux numériques optimisés tout en gérant la grande sparsité des données par des systèmes relationnels.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Ce papier présente la première utilisation des cœurs tensoriels FP64 des GPU NVIDIA, combinée à des optimisations de fusion de noyaux, pour accélérer significativement les simulations d'éléments finis d'ordre élevé à l'échelle exascale, offrant jusqu'à un doublement des performances et des gains d'efficacité énergétique de 83 % sur les architectures Grace Hopper et Grace Blackwell.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Cet article présente une architecture entièrement résidente sur GPU et sans verrou qui, grâce à une migration complète du pipeline de génération de segments et à un mécanisme de vol de travail asynchrone, permet de vérifier la conjecture de Goldbach jusqu'à 10¹³ en seulement 133,5 secondes sur un cluster de quatre GPU, réalisant ainsi une accélération algorithmique de 45,6 fois par rapport aux méthodes précédentes.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Cette note technique présente une implémentation JAX de la famille auto-échelonnée de Broyden pour les méthodes quasi-Newton, compatible avec la bibliothèque Optimistix et incluant des variantes comme BFGS et DFP, afin de faciliter leur adoption par la communauté JAX.

Ivan Bioli, Mikel Mendibe AbarrategiThu, 12 Ma🤖 cs.LG

Numerically stable evaluation of closed-form expressions for eigenvalues of $3 \times 3$ matrices

Cet article propose une méthode d'évaluation fermée et numériquement stable des valeurs propres de matrices réelles diagonalisables $3 \times 3$ via quatre invariants, démontrant à la fois une précision accrue et une vitesse de calcul dix fois supérieure à la bibliothèque LAPACK pour des cas difficiles.

Michal Habera, Andreas Zilian2026-03-06🔢 math

Simple generators of rational function fields

Cet article présente un algorithme efficace, implémenté et validé par des études de cas, qui calcule un ensemble de générateurs simple pour un sous-corps de fonctions rationnelles en utilisant des méthodes novatrices telles que l'interpolation sparse et la recherche de polynômes de degré fixe.

Alexander Demin, Gleb Pogudin2026-03-06🔢 math

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

Threadle est un moteur de stockage et de requête réseau open-source et économe en mémoire, écrit en C#, qui permet de gérer à l'échelle des réseaux multilayers et mixtes massifs grâce à une approche de pseudo-projection évitant la matérialisation coûteuse des projections bipartites.

Carl Nordlund, Yukun Jiao2026-03-06💻 cs