Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Die vorgestellte Arbeit stellt einen Dynamics-Aware Policy Learning (DAPL)-Rahmen vor, der durch explizite Modellierung kontaktinduzierter Dynamiken in überfüllten Umgebungen extrinsische Dexterity ohne manuell erstellte Heuristiken ermöglicht und dabei sowohl in Simulationen als auch in realen Szenarien signifikant bessere Erfolgsraten als herkömmliche Methoden erzielt.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

Die vorgestellte Arbeit führt den „Local Classifier Alignment" (LCA)-Verlust ein, um die Diskrepanz zwischen adaptiertem Backbone und klassenspezifischen Klassifikatoren im Kontext des kontinuierlichen Lernens zu überbrücken und dadurch katastrophales Vergessen zu verhindern sowie die Robustheit und Leistungsfähigkeit von Modellen auf Standard-Benchmarks signifikant zu steigern.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

Das Paper stellt MedMASLab vor, ein einheitliches Orchestrierungsframework und Benchmarking-Plattform, das durch die Einführung standardisierter Multimodal-Kommunikationsprotokolle, eines automatisierten klinischen Reasoning-Evaluators und eines umfassenden Datensatzes über 11 Organsysteme die Fragmentierung in der Forschung zu multimodalen medizinischen Multi-Agenten-Systemen adressiert und dabei kritische Leistungslücken bei domänenspezifischen Übergängen aufzeigt.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Das Paper stellt ACADiff vor, ein adaptives klinisch bewusstes latentes Diffusionsmodell, das fehlende multimodale Hirnbildgebungsdaten (sMRI, FDG-PET, AV45-PET) unter Einbeziehung klinischer Metadaten synthetisiert und dabei auch bei extremen 80 % fehlenden Daten eine überlegene Bildqualität und diagnostische Leistung erzielt.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

Das Paper stellt PathMem vor, ein speicherzentriertes Multimodal-Framework für Pathologie-MLLMs, das durch die Nachahmung des menschlichen Gedächtnisprozesses strukturiertes Fachwissen als Langzeitgedächtnis organisiert und über einen Memory Transformer kontextabhängig in das Arbeitsgedächtnis integriert, um die Diagnosegenauigkeit und Interpretierbarkeit signifikant zu verbessern.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Diese Arbeit stellt fest, dass konfidenzbasierte Enthaltungen in Rangentscheidungssystemen nur dann die Entscheidungsqualität monoton verbessern, wenn strukturelle Unsicherheit vorliegt, während sie bei kontextueller Unsicherheit versagen und somit eine Anpassung des Konfidenzsignals an den Unsicherheitstyp sowie eine Vorabprüfung der Bedingungen C1 und C2 für den erfolgreichen Einsatz erforderlich machen.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Die Studie zeigt, dass der Overfitting-Underfitting-Indicator (OUI) bereits zu einem frühen Trainingszeitpunkt von 10 % als wirksames Signal dient, um in PPO-Actor-Critic-Systemen stabile Lernraten von instabilen zu unterscheiden und dadurch ineffiziente Hyperparametersuchen durch eine präzise Früherkennung zu vermeiden.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Die Arbeit stellt „Neural Debuggers" vor, eine neue Klasse von Sprachmodellen, die traditionelle Debugger-Funktionen wie das Setzen von Haltepunkten und das schrittweise Durchlaufen von Code nachahmen, um sowohl die Vorwärts- als auch die Rückwärtsausführung von Python-Programmen zuverlässig zu modellieren und so die Grundlage für fortschrittlichere Agenten-basierte Codiersysteme zu legen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

Die Studie zeigt, dass im Gegensatz zum menschlichen Verhalten das Nachdenken bei großen Sprachmodellen die Ehrlichkeit erhöht, da der Prozess des moralischen Abwägens das Modell durch einen verzerrten Repräsentationsraum führt, in dem ehrliche Antworten stabiler sind als täuschende.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Das Paper stellt BEACON vor, ein System zur Vorhersage von Navigationsaffordanzen in einer vogelperspektivischen Wärmebildkarte, das durch die Kombination von Sprachanweisungen mit RGB-D-Observationen und einem visuell-sprachlichen Modell in der Lage ist, auch verdeckte Zielorte zu erkennen und so die Genauigkeit im Vergleich zu bildbasierten Methoden signifikant zu steigern.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Diese Studie untersucht die Nutzung eines von einem Large Language Model (LLM) angetriebenen virtuellen Führers durch 16 blinde und sehbehinderte Personen in sozialen VR-Umgebungen und zeigt, dass die Interaktionsweise je nach Anwesenheit anderer Nutzer zwischen einer instrumentellen Werkzeugnutzung und einer companionschaftlichen Beziehung wechselt, woraus wichtige Designempfehlungen für zukünftige barrierefreie VR-Systeme abgeleitet werden.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI