cs Arbeiten | Gist.Science

A prior information informed learning architecture for flying trajectory prediction

Diese Arbeit stellt ein hardware-effizientes Framework zur Vorhersage von Flugbahnen vor, das Umgebungs-prioritäten mit einer Dual-Transformer-Cascaded-Architektur kombiniert, um beispielsweise den Landepunkt von Tennisbällen präzise zu bestimmen und dabei bestehende Methoden in Genauigkeit und Effizienz übertrifft.

Xianda Huang, Zidong Han, Ruibo Jin, Zhenyu Wang, Wenyu Li, Xiaoyang Li, Yi Gong2026-03-10💻 cs

Robodimm: A Physics-Grounded Framework for Automated Actuator Sizing in Scalable Modular Robots

Das Paper stellt Robodimm vor, ein Software-Framework, das mithilfe von Pinocchio und Pink sowie einer KKT-Formulierung die automatisierte Dimensionierung von Aktuatoren für skalierbare modulare Roboter mit geschlossenen kinematischen Ketten ermöglicht, um Kosten, Masse und dynamische Leistung zu optimieren.

J. L. Torres, M. Munoz, J. D. Alvarez, J. L. Blanco, A. Gimenez2026-03-10💻 cs

CAR: Cross-Vehicle Kinodynamics Adaptation via Mobility Representation

Die Arbeit stellt CAR vor, ein Framework, das mithilfe eines Transformer-Encoders und eines gemeinsamen latenten Raums die kinodynamische Anpassung autonomer Fahrzeuge auf neue Plattformen mit minimalem Datenbedarf ermöglicht und so die Skalierbarkeit heterogener Roboterschwärme verbessert.

Tong Xu, Chenhui Pan, Xuesu Xiao2026-03-10💻 cs

LEAD: Breaking the No-Recovery Bottleneck in Long-Horizon Reasoning

Die Arbeit stellt LEAD (Lookahead-Enhanced Atomic Decomposition) vor, eine Methode, die durch kurze zukünftige Validierung und die Aggregation überlappender Rollouts die durch extreme Zerlegung verursachte „Nicht-Wiederherstellbarkeits-Blockade" in der langfristigen reasoning von LLMs überwindet und so die Stabilität und Lösbarkeit komplexer algorithmischer Aufgaben wie Checkers signifikant verbessert.

Denys Pushkin, Emmanuel Abbe2026-03-10💻 cs

PICS: Pairwise Image Compositing with Spatial Interactions

Das Paper stellt PICS vor, ein selbstüberwachtes Verfahren zur parallelen Bildkomposition, das mithilfe eines Interaktions-Transformers und maskengesteuerter Mixture-of-Experts-Modelle kohärente räumliche Beziehungen und physikalische Konsistenz bei der Einfügung mehrerer Objekte sicherstellt.

Hang Zhou, Xinxin Zuo, Sen Wang, Li Cheng2026-03-10💻 cs

Not Too Short, Not Too Long: How LLM Response Length Shapes People's Critical Thinking in Error Detection

Die Studie zeigt, dass bei der Fehlererkennung in LLM-Antworten die Länge der Erklärung den Einfluss der Richtigkeit der KI auf die menschliche Genauigkeit moderiert, wobei mittellange Erklärungen bei falschen LLM-Antworten zu einer besseren kritischen Bewertung führen als kurze oder lange.

Natalie Friedman, Adelaide Nyanyo, Kevin Weatherwax, Lifei Wang, Chengchao Zhu, Zeshu Zhu, S. Joy Mountford2026-03-10💻 cs

Material Driven HRI Design: Aesthetics as Explainability

Dieser vorläufige Beitrag schlägt einen Rahmen vor, der Materialien, Farben und Texturen als erklärbare Signale für die Mensch-Roboter-Interaktion nutzt, um durch gezielte ästhetische Gestaltung die Erwartungen der Nutzer an die Rolle und Fähigkeiten von Robotern zu klären.

Natalie Friedman, Kevin Weatherwax, Chengchao Zhu2026-03-10💻 cs

Notational Animating: An Interactive Approach to Creating and Editing Animation Keyframes

Die Arbeit stellt „Notational Animating" als interaktives Paradigma vor, bei dem Animator:innen Skizzen über statischen Zeichnungen anfertigen, die durch formale Repräsentation und KI-gestützte Interpretation in präzise Animations-Keyframes umgewandelt werden, um so eine nahtlose Brücke zwischen intuitiven Notationen und detaillierter Animation zu schlagen.

Xinyu Shi, Li-Yi Wei, Nanxuan Zhao, Jian Zhao, Rubaiat Habib Kazi2026-03-10💻 cs

Distributed Legal Infrastructure for a Trustworthy Agentic Web

Der Artikel schlägt eine verteilte Rechtsinfrastruktur vor, die aus fünf miteinander verknüpften Schichten besteht, um im auf KI-Agenten basierenden Web durch interoperable Protokolle für Identität, Entscheidungsfindung und Streitbeilegung eine vertrauenswürdige und rechenschaftspflichtige Governance zu gewährleisten.

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs

OPTED: Open Preprocessed Trachoma Eye Dataset Using Zero-Shot SAM 3 Segmentation

Die Studie stellt OPTED vor, einen offenen, vorverarbeiteten Datensatz für Trachom-Erkennung aus Äthiopien, der mithilfe des Zero-Shot-SAM-3-Modells automatisiert relevante Augenregionen aus klinischen Bildern extrahiert und so eine reproduzierbare Grundlage für maschinelles Lernen schafft.

Kibrom Gebremedhin, Hadush Hailu, Bruk Gebregziabher2026-03-10💻 cs

VertiAdaptor: Online Kinodynamics Adaptation for Vertically Challenging Terrain

Die Arbeit stellt VertiAdaptor vor, ein Online-Anpassungsframework, das Höhen- und semantische Informationen integriert, um die Kinodynamik autonomer Fahrzeuge in unstrukturiertem Gelände durch effiziente neuronale Basisfunktionen in Echtzeit anzupassen und so die Vorhersagegenauigkeit zu steigern sowie die Anpassungszeit drastisch zu verkürzen.

Tong Xu, Chenhui Pan, Aniket Datar, Xuesu Xiao2026-03-10💻 cs

Enhancing the Detection of Coronary Artery Disease Using Machine Learning

Diese Studie zeigt, dass ein hybrides Machine-Learning-Modell aus Bi-LSTM und GRU mit einer Genauigkeit von 97,07 % die Erkennung von koronarer Herzkrankheit im Vergleich zu herkömmlichen Diagnosemethoden verbessert und somit ein vielversprechendes Werkzeug für die personalisierte kardiovaskuläre Versorgung darstellt.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

SoK: Self-Sovereign Digital Identities

Diese Systematisierung des Wissens zu selbstsouveränen digitalen Identitäten (SSDI) analysiert 80 Quellen, um sechs zentrale Hindernisse für die breite Einführung zu identifizieren, bewertet 12 reale Anwendungen und zeigt auf, dass Selbstsouveränität in der Praxis ein Spektrum darstellt, um die Forschung und Adoption auf diesem Gebiet voranzutreiben.

Sushanth Ambati, Kainat Adeel, Jack Myers, Nikolay Ivanov2026-03-10💻 cs

Collaborative Planning with Concurrent Synchronization for Operationally Constrained UAV-UGV Teams

Die vorgestellte Arbeit entwickelt CoPCS, einen lernbasierten Ansatz, der heterogene Graph-Transformer und Transformer-Decoder nutzt, um die kollaborative Planung von UAV-UGV-Teams unter Berücksichtigung von Energie- und Geländebeschränkungen durch synchronisierte, gleichzeitige Koordination zu ermöglichen und so die Missionsleistung erheblich zu steigern.

Zihao Deng, Qianhuang Li, Peng Gao, Maggie Wigness, John Rogers, Donghyun Kim, Hao Zhang2026-03-10💻 cs

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

Die Studie stellt SELSM vor, ein training-freies Framework, das durch die Ableitung entitätsunabhängiger logischer Regeln aus simulierten klinischen Trajektorien und eine abfragegesteuerte Zwei-Phasen-Wiederherstellung die Null-Shot-Fähigkeiten lokal einsetzbarer medizinischer Agenten (30–32 Mrd. Parameter) für FHIR-basierte Aufgaben unter strikten Datenschutzbedingungen signifikant verbessert und dabei eine 100%ige Erfolgsrate bei der Aufgabenerfüllung erreicht.

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

SysNav: Multi-Level Systematic Cooperation Enables Real-World, Cross-Embodiment Object Navigation

Das Paper stellt SysNav vor, ein dreistufiges System, das durch die Entkopplung von semantischer Schlussfolgerung, Navigationsplanung und Bewegungssteuerung mittels Vision-Language-Modellen zuverlässige und effiziente Objekt-Navigation über große Distanzen in komplexen realen Umgebungen für verschiedene Roboterplattformen ermöglicht.

Haokun Zhu, Zongtai Li, Zihan Liu, Kevin Guo, Zhengzhi Lin, Yuxin Cai, Guofei Chen, Chen Lv, Wenshan Wang, Jean Oh, Ji Zhang2026-03-10💻 cs

PaQ-DETR: Learning Pattern and Quality-Aware Dynamic Queries for Object Detection

Der vorgestellte Ansatz PaQ-DETR verbessert die Objekterkennung durch eine dynamische, inhaltsabhängige Generierung von Abfragen und eine qualitätsbewusste Zuweisungsstrategie, die das Ungleichgewicht bei der Abfragenutzung überwindet und konsistente Genauigkeitssteigerungen auf verschiedenen Benchmarks erzielt.

Zhengjian Kang, Jun Zhuang, Kangtong Mo, Qi Chen, Rui Liu, Ye Zhang2026-03-10💻 cs

T2Nav Algebraic Topology Aware Temporal Graph Memory and Loop Detection for ZeroShot Visual Navigation

Die Arbeit stellt T2Nav vor, ein Zero-Shot-Navigationssystem für autonome Agenten, das algebraische Topologie, temporale Graphen und Loop-Detection nutzt, um in unbekannten Umgebungen effizient Hindernisse zu vermeiden, Schleifen zu erkennen und Ziele auf Basis von Referenzbildern zu erreichen.

Quang-Anh N. D., Duc Pham, Minh-Anh Nguyen, Tung Doan, Tuan Dang2026-03-10💻 cs

SurgSync: Time-Synchronized Multi-Modal Data Collection Framework and Dataset for Surgical Robotics

Das Paper stellt SurgSync vor, ein Framework zur synchronisierten Erfassung multimodaler chirurgischer Roboterdaten auf Basis des dVRK, das durch hochwertige Sensoren und eine Validierung an ex-vivo-Gewebe eine umfassende Datensammlung für das Training von KI-Systemen ermöglicht.

Haoying Zhou, Chang Liu, Yimeng Wu, Junlin Wu, Zijian Wu, Yu Chung Lee, Sara Martuscelli, Spetimiu E. Salcudean, Gregory S. Fischer, Peter Kazanzides2026-03-10💻 cs

DLRMamba: Distilling Low-Rank Mamba for Edge Multispectral Fusion Object Detection

Die Arbeit stellt DLRMamba vor, eine effiziente Methode zur Multispektral-Fusion für die Objekterkennung am Edge, die durch eine Low-Rank-SS2D-Architektur und strukturaware Distillation die Rechenkosten von Mamba-Modellen senkt, ohne die Detektionsgenauigkeit auf ressourcenbeschränkter Hardware zu beeinträchtigen.

Qianqian Zhang, Leon Tabaro, Ahmed M. Abdelmoniem, Junshe An2026-03-10💻 cs

← Zurück Weiter →