A prior information informed learning architecture for flying trajectory prediction

Diese Arbeit stellt ein hardware-effizientes Framework zur Vorhersage von Flugbahnen vor, das Umgebungs-prioritäten mit einer Dual-Transformer-Cascaded-Architektur kombiniert, um beispielsweise den Landepunkt von Tennisbällen präzise zu bestimmen und dabei bestehende Methoden in Genauigkeit und Effizienz übertrifft.

Xianda Huang, Zidong Han, Ruibo Jin, Zhenyu Wang, Wenyu Li, Xiaoyang Li, Yi Gong2026-03-10💻 cs

LEAD: Breaking the No-Recovery Bottleneck in Long-Horizon Reasoning

Die Arbeit stellt LEAD (Lookahead-Enhanced Atomic Decomposition) vor, eine Methode, die durch kurze zukünftige Validierung und die Aggregation überlappender Rollouts die durch extreme Zerlegung verursachte „Nicht-Wiederherstellbarkeits-Blockade" in der langfristigen reasoning von LLMs überwindet und so die Stabilität und Lösbarkeit komplexer algorithmischer Aufgaben wie Checkers signifikant verbessert.

Denys Pushkin, Emmanuel Abbe2026-03-10💻 cs

Not Too Short, Not Too Long: How LLM Response Length Shapes People's Critical Thinking in Error Detection

Die Studie zeigt, dass bei der Fehlererkennung in LLM-Antworten die Länge der Erklärung den Einfluss der Richtigkeit der KI auf die menschliche Genauigkeit moderiert, wobei mittellange Erklärungen bei falschen LLM-Antworten zu einer besseren kritischen Bewertung führen als kurze oder lange.

Natalie Friedman, Adelaide Nyanyo, Kevin Weatherwax, Lifei Wang, Chengchao Zhu, Zeshu Zhu, S. Joy Mountford2026-03-10💻 cs

Notational Animating: An Interactive Approach to Creating and Editing Animation Keyframes

Die Arbeit stellt „Notational Animating" als interaktives Paradigma vor, bei dem Animator:innen Skizzen über statischen Zeichnungen anfertigen, die durch formale Repräsentation und KI-gestützte Interpretation in präzise Animations-Keyframes umgewandelt werden, um so eine nahtlose Brücke zwischen intuitiven Notationen und detaillierter Animation zu schlagen.

Xinyu Shi, Li-Yi Wei, Nanxuan Zhao, Jian Zhao, Rubaiat Habib Kazi2026-03-10💻 cs

Distributed Legal Infrastructure for a Trustworthy Agentic Web

Der Artikel schlägt eine verteilte Rechtsinfrastruktur vor, die aus fünf miteinander verknüpften Schichten besteht, um im auf KI-Agenten basierenden Web durch interoperable Protokolle für Identität, Entscheidungsfindung und Streitbeilegung eine vertrauenswürdige und rechenschaftspflichtige Governance zu gewährleisten.

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs

Collaborative Planning with Concurrent Synchronization for Operationally Constrained UAV-UGV Teams

Die vorgestellte Arbeit entwickelt CoPCS, einen lernbasierten Ansatz, der heterogene Graph-Transformer und Transformer-Decoder nutzt, um die kollaborative Planung von UAV-UGV-Teams unter Berücksichtigung von Energie- und Geländebeschränkungen durch synchronisierte, gleichzeitige Koordination zu ermöglichen und so die Missionsleistung erheblich zu steigern.

Zihao Deng, Qianhuang Li, Peng Gao, Maggie Wigness, John Rogers, Donghyun Kim, Hao Zhang2026-03-10💻 cs

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

Die Studie stellt SELSM vor, ein training-freies Framework, das durch die Ableitung entitätsunabhängiger logischer Regeln aus simulierten klinischen Trajektorien und eine abfragegesteuerte Zwei-Phasen-Wiederherstellung die Null-Shot-Fähigkeiten lokal einsetzbarer medizinischer Agenten (30–32 Mrd. Parameter) für FHIR-basierte Aufgaben unter strikten Datenschutzbedingungen signifikant verbessert und dabei eine 100%ige Erfolgsrate bei der Aufgabenerfüllung erreicht.

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

SysNav: Multi-Level Systematic Cooperation Enables Real-World, Cross-Embodiment Object Navigation

Das Paper stellt SysNav vor, ein dreistufiges System, das durch die Entkopplung von semantischer Schlussfolgerung, Navigationsplanung und Bewegungssteuerung mittels Vision-Language-Modellen zuverlässige und effiziente Objekt-Navigation über große Distanzen in komplexen realen Umgebungen für verschiedene Roboterplattformen ermöglicht.

Haokun Zhu, Zongtai Li, Zihan Liu, Kevin Guo, Zhengzhi Lin, Yuxin Cai, Guofei Chen, Chen Lv, Wenshan Wang, Jean Oh, Ji Zhang2026-03-10💻 cs

SurgSync: Time-Synchronized Multi-Modal Data Collection Framework and Dataset for Surgical Robotics

Das Paper stellt SurgSync vor, ein Framework zur synchronisierten Erfassung multimodaler chirurgischer Roboterdaten auf Basis des dVRK, das durch hochwertige Sensoren und eine Validierung an ex-vivo-Gewebe eine umfassende Datensammlung für das Training von KI-Systemen ermöglicht.

Haoying Zhou, Chang Liu, Yimeng Wu, Junlin Wu, Zijian Wu, Yu Chung Lee, Sara Martuscelli, Spetimiu E. Salcudean, Gregory S. Fischer, Peter Kazanzides2026-03-10💻 cs