Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning

Die Arbeit zeigt, dass überwachtes Sicherheitstraining bei Vision-Language-Modellen durch irreführende oberflächliche Korrelationen anfällig für Umgehungsangriffe und übermäßige Zurückhaltung bleibt, und demonstriert, dass maschinelles Vergessen (Machine Unlearning) eine überlegene Alternative ist, um schädliches Wissen gezielt zu entfernen und gleichzeitig die Sicherheit sowie die Leistungsfähigkeit der Modelle zu verbessern.

Yiwei Chen, Yuguang Yao, Yihua Zhang + 3 more2026-03-06💻 cs

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

Diese Studie stellt ein neuartiges, skalierbares Evaluierungsframework vor, das zeigt, dass die Fähigkeit von Large Language Models zur Fehlerlokalisation durch semantisch erhaltende Mutationen stark beeinträchtigt wird, was auf eine übermäßige Abhängigkeit von syntaktischen Merkmalen anstelle eines tiefen semantischen Verständnisses hinweist.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

Boundary-Guided Trajectory Prediction for Road Aware and Physically Feasible Autonomous Driving

Diese Arbeit stellt ein neuartiges Framework für die Trajektorienvorhersage im autonomen Fahren vor, das durch die Begrenzung auf zulässige Fahrwege und die Einhaltung kinematischer Constraints sowohl die Vorhersage von Fahrten außerhalb der Straße als auch physikalisch nicht machbare Trajektorien effektiv verhindert und dabei eine robuste Generalisierungsfähigkeit aufweist.

Ahmed Abouelazm, Mianzhi Liu, Christian Hubschneider + 3 more2026-03-06💻 cs

Automatic Curriculum Learning for Driving Scenarios: Towards Robust and Efficient Reinforcement Learning

Diese Arbeit stellt ein automatisches Curriculum-Learning-Framework vor, das durch einen „Lehrer"-Agenten adaptive und auf die Lernfähigkeit des Fahragents abgestimmte Fahrszenarien generiert, um die Trainingseffizienz und Generalisierungsfähigkeit von Reinforcement-Learning-Modellen für autonomes Fahren im Vergleich zu festen Szenarien und Domänenrandomisierung signifikant zu verbessern.

Ahmed Abouelazm, Tim Weinstein, Tim Joseph + 2 more2026-03-06💻 cs

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

Das Paper stellt RoboPARA vor, ein von großen Sprachmodellen gesteuertes Framework für die parallele Aufgabenplanung bei Zweiarm-Robotern, das durch einen zweistufigen Prozess auf Basis von Abhängigkeitsgraphen die Effizienz und Zuverlässigkeit in komplexen Multitasking-Szenarien signifikant verbessert und dabei durch die Einführung des X-DAPT-Datensatzes erstmals eine umfassende Evaluierung ermöglicht.

Shiying Duan, Pei Ren, Nanxiang Jiang + 5 more2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

Die Studie stellt HSG-12M vor, einen umfassenden Datensatz mit über 16 Millionen räumlichen Multigraphen, der mithilfe des automatisierten Poly2Graph-Pipelines aus nicht-hermiteschen Kristallspektren generiert wurde, um als Benchmark für geometriebewusstes Graph-Learning und datengetriebene Entdeckungen in der kondensierten Materie zu dienen.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

Bures-Wasserstein Flow Matching for Graph Generation

Diese Arbeit stellt BWFlow vor, ein neuartiges Flow-Matching-Framework für die Graphengenerierung, das durch die Modellierung der gemeinsamen Entwicklung von Knoten und Kanten mittels Markov-Zufallsfeldern und optimaler Transporttheorie auf der Bures-Wasserstein-Metrik einen glatten Wahrscheinlichkeitspfad schafft, der die Trainingskonvergenz verbessert und die Sampling-Effizienz steigert.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs