Tight Robustness Certification Through the Convex Hull of 0\ell_0 Attacks

Die Autoren zeigen, dass die konvexe Hülle einer 0\ell_0-Kugel durch einen asymmetrisch skalierten 1\ell_1-ähnlichen Polytop approximiert werden kann, und entwickeln eine darauf basierende lineare Schrankenpropagierung, die die Effizienz bestehender 0\ell_0-Robustheitsverifizierer um das 3,16-fache (geometrisches Mittel) steigert.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Diese Studie zeigt, dass durch die Crowdsourcing-Initiative eines Kaggle-Wettbewerbs entwickelte hybride Physik-ML-Parameterisierungen in einem interaktiven Klimamodell nicht nur eine bisher unerreichte Online-Stabilität erreichen, sondern auch State-of-the-Art-Ergebnisse für globale Klimaprojektionen liefern.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Die Studie stellt ForamDeepSlice vor, ein hochpräzises Deep-Learning-Framework, das auf einem Ensemble von CNN-Architekturen basiert und eine Genauigkeit von 95,64 % bei der automatisierten Klassifizierung von Foraminiferen-Arten aus 2D-Mikro-CT-Schnitten erreicht, wodurch ein neuer Benchmark für die KI-gestützte mikropaläontologische Identifizierung gesetzt wird.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

Das Paper stellt MSPT vor, einen effizienten Transformer-basierten Solver, der durch die Kombination von lokaler Punkt- und globaler Patch-Aufmerksamkeit sowie die Nutzung von Ball-Bäumen für die Patch-Partitionierung physikalische Simulationen mit Millionen von Elementen auf einer einzigen GPU mit hohem Genauigkeitsniveau und geringem Ressourcenbedarf ermöglicht.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

Die Arbeit stellt DROCO vor, einen neuen Algorithmus für das cross-domain Offline-Reinforcement-Learning, der durch einen robusten Bellman-Operator und zusätzliche Regularisierungstechniken sowohl Trainings- als auch Testzeit-Robustheit gegenüber Dynamikverschiebungen gewährleistet und dabei die Leistung bestehender Methoden übertrifft.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

Die Arbeit stellt GoRL vor, ein algorithmusagnostisches Framework, das durch die Entkopplung von Optimierung in einem handhabbaren latenten Raum und der Generierung von Aktionen mittels eines bedingten Decoders stabile und ausdrucksstarke Richtlinien für das Online-Reinforcement-Learning ermöglicht und dabei bestehende Baseline-Methoden in kontinuierlichen Steuerungsaufgaben deutlich übertrifft.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Diese Arbeit stellt ein zweistufiges generatives Daten-Augmentierungsverfahren vor, das regelbasierte Maskenverformung mit unpaariger Bild-zu-Bild-Übersetzung mittels GANs kombiniert, um trotz erheblicher Ressourcenbeschränkungen und ohne KI-Unterstützung effektive Trainingsdaten für die Erkennung und Identifizierung von maskierten Gesichtern zu erzeugen.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

Die Studie stellt LaMer vor, ein Meta-RL-Framework, das Sprachagenten durch eine cross-episodische Trainingsstruktur und kontextbasierte Reflexion befähigt, aktiv zu explorieren und sich ohne Gradientenupdates an Umgebungen anzupassen, was zu signifikant besseren Leistungen und einer stärkeren Generalisierungsfähigkeit im Vergleich zu herkömmlichen RL-Ansätzen führt.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Diese Arbeit stellt drei komplementäre Strategien vor, um das sequenzielle Limit des Newton-Kaczmarz-basierten Trainings von Kolmogorov-Arnold-Netzwerken (KANs) durch eine angepasste Vortrainingsmethode, das Zusammenführen von Modellen, die auf disjunkten Datensätzen trainiert wurden, und eine FPGA-spezifische Parallelisierung zu überwinden und so die Konvergenzgeschwindigkeit erheblich zu steigern.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG