Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

Das Paper stellt HCLA vor, ein menschenzentriertes Multi-Agenten-System, das durch die Trennung von Evidenzbewertung und expertenähnlicher Begründung die Interpretierbarkeit und Rechenschaftspflicht bei der Erkennung anomaler Transaktionen digitaler Vermögenswerte verbessert, indem es algorithmische Befunde mit regulatorischen Urteilen in Einklang bringt.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

Automated Pest Counting in Water Traps through Active Robotic Stirring for Occlusion Handling

Diese Arbeit stellt ein automatisiertes System zur Zählung von Schädlingen in Wasserfallen vor, das durch einen robotergesteuerten Rührmechanismus mit adaptiver Geschwindigkeit und optimierten Rührmustern die durch Überlappungen verursachten Zählfehler signifikant reduziert und gleichzeitig die Effizienz im Vergleich zu herkömmlichen statischen Bildanalysen steigert.

Xumin Gao, Mark Stevens, Grzegorz Cielniak2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

Das Paper stellt LagMemo vor, ein Navigationssystem, das eine 3D-Gauß-Splatting-Speichertechnologie mit Sprachdaten nutzt, um effiziente, offene und multimodale Zielsuche in komplexen Umgebungen zu ermöglichen, und wird durch den neu erstellten GOAT-Core-Datensatz rigoros evaluiert.

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

MobiDock: Design and Control of A Modular Self Reconfigurable Bimanual Mobile Manipulator via Robotic Docking

Die Studie stellt MobiDock vor, ein modulares, selbstrekonfigurierbares bimanuelles mobiles Manipulatorsystem, das durch eine autonome visuelle Docking-Strategie und einen neuen Gewindeschrauben-Verschluss zwei Roboter zu einer stabilen Einheit verbindet, wodurch die Koordination vereinfacht und die dynamische Stabilität sowie die Effizienz bei komplexen Aufgaben im Vergleich zu unabhängig kooperierenden Robotern signifikant verbessert werden.

Xuan-Thuan Nguyen, Khac Nam Nguyen, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Hoang Hiep Ly, Tung D. Ta2026-03-10💻 cs

Vectorized Online POMDP Planning

Das Paper stellt VOPP vor, einen vektorisierten Online-POMDP-Planer, der durch die Umwandlung aller Planungsdatenstrukturen in Tensoren und die vollständige Vektorisierung der Berechnungen massive Parallelisierung ohne Synchronisationsengpässe ermöglicht und damit sowohl effizientere Lösungen als auch eine um den Faktor 1000 reduzierte Planungsbudget-Nutzung im Vergleich zu bestehenden Solvern erreicht.

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

Counting Through Occlusion: Framework for Open World Amodal Counting

Die Arbeit stellt CountOCC vor, ein Framework für das amodale Zählen in offenen Umgebungen, das durch hierarchische multimodale Führung und einen visuellen Äquivalenz-Objektiv die durch Verdeckung verursachten Fehlerzustände überwindet und damit neue State-of-the-Art-Ergebnisse auf verdeckungsreichen Datensätzen erzielt.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

Das Paper stellt LAMP vor, ein Framework für sprachaugmentiertes Multi-Agenten-Reinforcement-Learning, das durch eine „Denken-Sprechen-Entscheiden"-Pipeline numerische Daten mit sprachlicher Analyse verbindet und in Wirtschaftssimulationen signifikant bessere Ergebnisse als herkömmliche MARL- oder reine LLM-Ansätze erzielt.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning

Der Artikel stellt Video2Layout vor, ein Framework, das mithilfe von kontinuierlichen Objektgrenzkoordinaten und einem zweistufigen Feinabstimmungsprozess metrisch fundierte räumliche Layouts aus Videos rekonstruiert, um die Fähigkeiten von Multimodalen Large Language Models zur räumlichen推理 im Vergleich zu diskretisierten Gitterkarten signifikant zu verbessern.

Yibin Huang, Wang Xu, Wanyue Zhang, Helu Zhi, Jingjing Huang, Yangbin Xu, Yangang Sun, Conghui Zhu, Tiejun Zhao2026-03-10💻 cs

Learning to Think Fast and Slow for Visual Language Models

Die Arbeit stellt DualMindVLM vor, ein visuelles Sprachmodell, das durch eine adaptive Dual-System-Architektur und GRPO-basiertes Training die natürliche Tendenz von Modellen zu unterschiedlich langen Antworten nutzt, um bei komplexen Aufgaben tiefgründiges Nachdenken mit effizienten, schnellen Reaktionen bei einfachen Fragen zu verbinden und dabei sowohl die Leistung als auch die Token-Effizienz zu maximieren.

Chenyu Lin, Cheng Chi, Jinlin Wu, Sharon Li, Kaiyang Zhou2026-03-10💻 cs

Radiative-Structured Neural Operator for Continuous and Extrapolative Spectral Super-Resolution

Die vorgestellte Arbeit stellt den Radiative-Structured Neural Operator (RSNO) vor, einen neuartigen Ansatz zur kontinuierlichen spektralen Super-Auflösung, der physikalische Strahlungsprinzipien und eine mehrstufige Architektur nutzt, um realistischere hyperspektrale Bilder aus multispektralen Beobachtungen zu rekonstruieren und dabei Farbverzerrungen zu minimieren.

Ziye Zhang, Bin Pan, Zhenwei Shi2026-03-10💻 cs