cs.AI Arbeiten | Gist.Science

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Die Arbeit stellt HTMuon vor, einen optimierten Muon-Algorithmus, der durch heavy-tailed spektrale Korrektur die Leistung von LLMs und Bildklassifizierung verbessert, indem er die Unterdrückung schwerer Verteilungsschwänze im Muon-Update vermeidet und theoretisch als steilster Abstieg unter Schatten-q-Norm-Bedingungen analysiert wird.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

ADVERSA: Measuring Multi-Turn Guardrail Degradation and Judge Reliability in Large Language Models

Die Studie ADVERSA stellt ein automatisiertes Red-Teaming-Framework vor, das die Degradierung von Sicherheitsguardrails in großen Sprachmodellen über mehrere Gesprächsrunden hinweg als kontinuierliche Trajektorien misst und dabei die Zuverlässigkeit von Bewertungsmodellen sowie das Phänomen früher Jailbreaks in den Vordergrund stellt.

Harry Owiredu-Ashley2026-03-12🤖 cs.AI

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Die Studie wendet erstmals Sparse Autoencoder auf das Zeitreihen-Modell Chronos-T5 an und zeigt durch kausale Feature-Ablation, dass kritische Vorhersagefähigkeiten nicht in den semantisch reichsten, sondern in den mittleren Schichten verankert sind, die abrupte Dynamiken erkennen, während eine progressive Ablation der finalen Schichten die Prognosequalität paradoxerweise verbessert.

Anurag Mishra2026-03-12🤖 cs.LG

Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation

Die Studie analysiert das Versprechen und die Grenzen von Large Language Models bei der automatisierten Behebung von Java-Sicherheitslücken und zeigt, dass diese zwar oft funktionale Integrität bewahren, jedoch aufgrund semantischer Missverständnisse in der Hälfte der Fälle sowohl Sicherheits- als auch Funktionsanforderungen verfehlen.

Amir Al-Maamari2026-03-12🤖 cs.AI

Marginals Before Conditionals

Die Studie zeigt, dass neuronale Netze bei einer mehrdeutigen Zuordnungsaufgabe zunächst eine marginale Verteilung lernen, die durch eine Plateauphase der Entropie stabilisiert wird, bevor sie durch einen scharfen kollektiven Übergang zur vollständigen bedingten Verteilung übergehen, wobei Rauschen und die Datengröße die Dauer dieses Plateaus bestimmen.

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

TASER: Task-Aware Spectral Energy Refine for Backdoor Suppression in UAV Swarms Decentralized Federated Learning

Die Arbeit stellt TASER vor, ein dezentrales Verteidigungsframework für UAV-Schwärme, das durch die Analyse und gezielte Filterung spektraler Energieverteilungen in Gradienten effizient und robust gegen ausgeklügelte Backdoor-Angriffe vorgeht, ohne auf komplexe Ausreißererkennung angewiesen zu sein.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

Die Studie stellt „Amnesia" vor, einen leichten adversarialen Angriff im Aktivierungsraum, der durch Manipulation interner Transformer-Zustände Sicherheitsmechanismen in offenen Large Language Models umgeht und so die Erzeugung schädlicher Inhalte ohne Nachtraining ermöglicht.

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Digging Deeper: Learning Multi-Level Concept Hierarchies

Die vorgestellte Arbeit überwindet die Beschränkung flacher Konzeptmodelle durch die Entwicklung von Multi-Level Concept Splitting (MLCS) zur Entdeckung mehrstufiger Konzept-Hierarchien aus nur grober Überwachung und Deep-HiCEMs als Architektur, die diese Hierarchien für interpretierbare Eingriffe auf verschiedenen Abstraktionsebenen nutzbar macht.

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

Das Paper stellt KernelSkill vor, ein Multi-Agenten-Framework mit einer dualen Speicherarchitektur, das durch die Nutzung von wissensbasierten Expertenfähigkeiten anstelle impliziter Heuristiken GPU-Kernel-Optimierungen effizienter und interpretierbarer gestaltet und dabei auf dem KernelBench signifikante Geschwindigkeitssteigerungen erzielt.

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

Die Arbeit stellt ES-dLLM vor, ein trainingsfreies Beschleunigungsframework für Diffusion-Sprachmodelle, das durch das frühzeitige Überspringen weniger wichtiger Token in den unteren Schichten die Inferenzgeschwindigkeit erheblich steigert, ohne die Generierungsqualität zu beeinträchtigen.

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

Multi-Stream Perturbation Attack: Breaking Safety Alignment of Thinking LLMs Through Concurrent Task Interference

Die vorgestellte Arbeit führt einen Multi-Stream-Perturbation-Angriff ein, der durch das gleichzeitige Verflechten mehrerer Aufgabenströme den Sicherheitsabgleich von denkenden LLMs umgeht und dabei zu einem Zusammenbruch des Denkprozesses sowie zu wiederholten Ausgaben führt.

Fan Yang2026-03-12🤖 cs.AI

Execution Is the New Attack Surface: Survivability-Aware Agentic Crypto Trading with OpenClaw-Style Local Executors

Die Arbeit stellt „Survivability-Aware Execution" (SAE) als eine Middleware-Schicht vor, die für OpenClaw-ähnliche Krypto-Handelsagenten durch die Durchsetzung nicht umgehbarer Invarianten wie Risikobudgets und Staging-Protokolle die Sicherheit vor Ausführungsschäden in unsicheren Skill-Umgebungen gewährleistet und dabei die maximale Drawdown-Rate um über 93 % senkt.

Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Serhii Hovorov, Sofiia Pidturkina2026-03-12🤖 cs.AI

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

Die Arbeit stellt Equivariant Asynchronous Diffusion (EAD) vor, ein neues Diffusionsmodell, das durch einen adaptiven, asynchronen Denoising-Plan die Hierarchie molekularer Strukturen besser erfasst und gleichzeitig einen molekülweiten Horizont bewahrt, um den Stand der Technik bei der Generierung 3D-molekularer Konformationen zu erreichen.

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Code-Space Response Oracles: Generating Interpretable Multi-Agent Policies with Large Language Models

Die Arbeit stellt Code-Space Response Oracles (CSRO) vor, ein neuartiges Framework, das in Multi-Agenten-Systemen herkömmliche Reinforcement-Learning-Orakel durch Large Language Models ersetzt, um direkt als menschenlesbarer Code generierte, interpretierbare und wettbewerbsfähige Strategien zu ermöglichen.

Daniel Hennes, Zun Li, John Schultz, Marc Lanctot2026-03-12🤖 cs.AI

Hardware Efficient Approximate Convolution with Tunable Error Tolerance for CNNs

Die Arbeit stellt einen hardwareeffizienten Ansatz für CNNs vor, der mittels einer „weichen Sparsity"-Strategie und einer MSB-basierten Proxy-Methode als RISC-V-Instruktion signifikante Reduktionen bei MAC-Operationen und Energieverbrauch erreicht, ohne dabei die Genauigkeit zu beeinträchtigen.

Vishal Shashidhar, Anupam Kumari, Roy P Paily2026-03-12🤖 cs.LG

CLIPO: Contrastive Learning in Policy Optimization Generalizes RLVR

Das Papier stellt CLIPO vor, eine Methode zur Verallgemeinerung von Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) durch kontrastives Lernen, die die Robustheit und Generalisierungsfähigkeit von Large Language Models verbessert, indem sie inkonsistente Zwischenschritte in korrekten Lösungswegen erkennt und Halluzinationen unterdrückt.

Sijia Cui, Pengyu Cheng, Jiajun Song, Yongbo Gai, Guojun Zhang, Zhechao Yu, Jianhe Lin, Xiaoxi Jiang, Guanjun Jiang2026-03-12🤖 cs.LG

Lost in the Middle at Birth: An Exact Theory of Transformer Position Bias

Diese Arbeit beweist, dass die „Lost in the Middle"-Phänomen-U-Kurve bereits bei der Initialisierung von Transformer-Modellen als inhärente geometrische Eigenschaft der kausalen Aufmerksamkeit und Residualverbindungen existiert, unabhängig von Positionscodings oder Training.

Borun D Chowdhury2026-03-12🤖 cs.LG

AR-VLA: True Autoregressive Action Expert for Vision-Language-Action Models

Die Arbeit stellt AR-VLA vor, ein autonomes autoregressives Aktions-Expert-Modell, das durch eine langfristige Gedächtnisarchitektur und einen Neu-Ankerungsmechanismus zeitlich konsistente, kontextbewusste Roboteraktionen erzeugt und damit die Grenzen reaktiver Vision-Language-Action-Modelle überwindet.

Yutong Hu, Jan-Nico Zaech, Nikolay Nikolov, Yuanqi Yao, Sombit Dey, Giuliano Albanese, Renaud Detry, Luc Van Gool, Danda Paudel2026-03-12🤖 cs.AI

Agentic Control Center for Data Product Optimization

Die Arbeit stellt ein System vor, das mithilfe spezialisierter KI-Agenten in einem kontinuierlichen Optimierungszyklus die Erstellung und Verbesserung von Datenprodukten automatisiert, indem es Fragen aufzeigt, Qualitätsmetriken überwacht und menschliche Eingriffe ermöglicht, um Vertrauen und Kontrolle zu gewährleisten.

Priyadarshini Tamilselvan, Gregory Bramble, Sola Shirai, Ken C. L. Wong, Faisal Chowdhury, Horst Samulowitz2026-03-12🤖 cs.AI

The Generation-Recognition Asymmetry: Six Dimensions of a Fundamental Divide in Formal Language Theory

Die Arbeit identifiziert sechs Dimensionen, darunter neuartige Aspekte wie Richtung und Zeitlichkeit, die eine fundamentale operationale Asymmetrie zwischen der Erzeugung und der Erkennung formaler Sprachen aufzeigen, wobei sie die verbreitete Annahme widerlegt, dass Erzeugung immer einfacher sei als Parsing, und die anhaltende Trennung dieser Prozesse in modernen KI-Modellen kritisch beleuchtet.

Romain Peyrichou2026-03-12💬 cs.CL

← Zurück Weiter →