cs.MS Arbeiten | Gist.Science

Efficient and Flexible Multirate Temporal Adaptivity

Diese Arbeit stellt neue multirate Zeitadaptivitätscontroller für eingebettete multirate infinitesimale (MRI) Integrationsverfahren vor, die durch die Einführung erster fünfter Ordnung eingebetteter MERK-Methoden und umfangreicher Benchmarks effiziente und flexible Simulationen von Problemen mit beliebigen Zeitskalen ermöglichen.

Daniel R. Reynolds, Sylvia Amihere, Dashon Mitchell, Vu Thai LuanWed, 11 Ma🔢 math

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

Die Arbeit stellt \texttt{EinSum} vor, eine tensor-relationale Erweiterung der Einstein-Summation, die große, dünnbesetzte Berechnungen durch die automatische Umformulierung in relationale Operationen für die Sparsity-Verwaltung und effiziente numerische Kerne für rechenintensive Teile optimiert.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

Accelerating High-Order Finite Element Simulations at Extreme Scale with FP64 Tensor Cores

Diese Arbeit demonstriert erstmals die direkte Programmierung von FP64-Tensor-Cores auf NVIDIA-GPUs zur Beschleunigung hochauflösender Finite-Elemente-Simulationen in der MFEM-Bibliothek, wodurch auf Exascale-Systemen bis zu eine Verdopplung der Leistung und signifikante Energieeffizienzgewinne erzielt werden.

Jiqun Tu, Ian Karlin, John Camier, Veselin Dobrev, Tzanio Kolev, Stefan Henneking, Omar GhattasWed, 11 Ma💻 cs

A Lock-Free, Fully GPU-Resident Architecture for the Verification of Goldbach's Conjecture

Die vorgestellte Arbeit stellt eine vollständig GPU-residente, sperrenfreie Multi-GPU-Architektur vor, die durch den vollständigen Umzug des Sieb-Generierungsprozesses auf die GPU und die Einführung eines asynchronen Work-Stealing-Pools die Goldbach-Vermutung bis zu $10^{13}$ mit einer Geschwindigkeit von 133,5 Sekunden auf einem Vier-GPU-System verifiziert und dabei eine algorithmische Beschleunigung von 45,6-fach gegenüber vorherigen Ansätzen erreicht.

Isaac Llorente-SaguerTue, 10 Ma🔢 math

Self-Scaled Broyden Family of Quasi-Newton Methods in JAX

Dieser technische Bericht dokumentiert eine JAX-kompatible Implementierung der selbstskalierten Broyden-Familie von Quasi-Newton-Verfahren (einschließlich BFGS, DFP und Broyden mit ihren selbstskalierten Varianten) auf Basis der Optimistix-Bibliothek, um deren Nutzung in der JAX-Community zu erleichtern.

Ivan Bioli, Mikel Mendibe AbarrategiThu, 12 Ma🤖 cs.LG

Numerically stable evaluation of closed-form expressions for eigenvalues of $3 \times 3$ matrices

Diese Arbeit stellt numerisch stabile, geschlossene Formeln zur Berechnung der Eigenwerte reeller, diagonalisierbarer $3 \times 3$-Matrizen vor, die auf vier Invarianten basieren, und zeigt durch Fehleranalysen sowie Benchmarks, dass der vorgeschlagene Algorithmus bei vergleichbarer Genauigkeit etwa zehnmal schneller als die LAPACK-Bibliothek ist.

Michal Habera, Andreas Zilian2026-03-06🔢 math

Simple generators of rational function fields

Dieses Paper stellt einen effizienten Algorithmus vor, der unter Verwendung von partiellen Gröbner-Basis-Berechnungen und dünnbesetzter Interpolation eine vereinfachte Erzeugendensmenge für rationale Funktionenkörper findet und damit sowohl in der Leistungsfähigkeit als auch in der Ergebnisqualität den aktuellen Stand der Technik verbessert.

Alexander Demin, Gleb Pogudin2026-03-06🔢 math

Threadle: A Memory-Efficient Network Storage and Query Engine for Large, Multilayer, and Mixed-mode Networks

Threadle ist eine speicher-effiziente, in C# entwickelte Open-Source-Engine, die es ermöglicht, extrem große, mehrschichtige und gemischte Netzwerke mit Millionen von Knoten und Milliarden von Kanten durch eine innovative Pseudo-Projektions-Methode zu speichern und abzufragen, ohne die speicherintensive explizite Projektion zu materialisieren.

Carl Nordlund, Yukun Jiao2026-03-06💻 cs