HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Die Arbeit stellt HTMuon vor, einen optimierten Muon-Algorithmus, der durch heavy-tailed spektrale Korrektur die Leistung von LLMs und Bildklassifizierung verbessert, indem er die Unterdrückung schwerer Verteilungsschwänze im Muon-Update vermeidet und theoretisch als steilster Abstieg unter Schatten-q-Norm-Bedingungen analysiert wird.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Die Studie wendet erstmals Sparse Autoencoder auf das Zeitreihen-Modell Chronos-T5 an und zeigt durch kausale Feature-Ablation, dass kritische Vorhersagefähigkeiten nicht in den semantisch reichsten, sondern in den mittleren Schichten verankert sind, die abrupte Dynamiken erkennen, während eine progressive Ablation der finalen Schichten die Prognosequalität paradoxerweise verbessert.

Anurag Mishra2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Das Paper stellt KernelSkill vor, ein Multi-Agenten-Framework mit einer dualen Speicherarchitektur, das durch die Nutzung von wissensbasierten Expertenfähigkeiten anstelle impliziter Heuristiken GPU-Kernel-Optimierungen effizienter und interpretierbarer gestaltet und dabei auf dem KernelBench signifikante Geschwindigkeitssteigerungen erzielt.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors

Die Arbeit stellt „Survivability-Aware Execution" (SAE) als eine Middleware-Schicht vor, die für OpenClaw-ähnliche Krypto-Handelsagenten durch die Durchsetzung nicht umgehbarer Invarianten wie Risikobudgets und Staging-Protokolle die Sicherheit vor Ausführungsschäden in unsicheren Skill-Umgebungen gewährleistet und dabei die maximale Drawdown-Rate um über 93 % senkt.

Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Serhii Hovorov, Sofiia Pidturkina2026-03-12🤖 cs.AI

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

Die Arbeit stellt Equivariant Asynchronous Diffusion (EAD) vor, ein neues Diffusionsmodell, das durch einen adaptiven, asynchronen Denoising-Plan die Hierarchie molekularer Strukturen besser erfasst und gleichzeitig einen molekülweiten Horizont bewahrt, um den Stand der Technik bei der Generierung 3D-molekularer Konformationen zu erreichen.

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

Das Papier stellt CLIPO vor, eine Methode zur Verallgemeinerung von Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) durch kontrastives Lernen, die die Robustheit und Generalisierungsfähigkeit von Large Language Models verbessert, indem sie inkonsistente Zwischenschritte in korrekten Lösungswegen erkennt und Halluzinationen unterdrückt.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

Die Arbeit stellt AR-VLA vor, ein autonomes autoregressives Aktions-Expert-Modell, das durch eine langfristige Gedächtnisarchitektur und einen Neu-Ankerungsmechanismus zeitlich konsistente, kontextbewusste Roboteraktionen erzeugt und damit die Grenzen reaktiver Vision-Language-Action-Modelle überwindet.

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel2026-03-12🤖 cs.AI

Agentic Control Center for Data Product Optimization

Die Arbeit stellt ein System vor, das mithilfe spezialisierter KI-Agenten in einem kontinuierlichen Optimierungszyklus die Erstellung und Verbesserung von Datenprodukten automatisiert, indem es Fragen aufzeigt, Qualitätsmetriken überwacht und menschliche Eingriffe ermöglicht, um Vertrauen und Kontrolle zu gewährleisten.

Priyadarshini Tamilselvan, Gregory Bramble, Sola Shirai, Ken C. L. Wong, Faisal Chowdhury, Horst Samulowitz2026-03-12🤖 cs.AI

The Generation-Recognition Asymmetry: Six Dimensions of a Fundamental Divide in Formal Language Theory

Die Arbeit identifiziert sechs Dimensionen, darunter neuartige Aspekte wie Richtung und Zeitlichkeit, die eine fundamentale operationale Asymmetrie zwischen der Erzeugung und der Erkennung formaler Sprachen aufzeigen, wobei sie die verbreitete Annahme widerlegt, dass Erzeugung immer einfacher sei als Parsing, und die anhaltende Trennung dieser Prozesse in modernen KI-Modellen kritisch beleuchtet.

Romain Peyrichou2026-03-12💬 cs.CL