Counting Through Occlusion: Framework for Open World Amodal Counting

Die Arbeit stellt CountOCC vor, ein Framework für das amodale Zählen in offenen Umgebungen, das durch hierarchische multimodale Führung und einen visuellen Äquivalenz-Objektiv die durch Verdeckung verursachten Fehlerzustände überwindet und damit neue State-of-the-Art-Ergebnisse auf verdeckungsreichen Datensätzen erzielt.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

Das Paper stellt LAMP vor, ein Framework für sprachaugmentiertes Multi-Agenten-Reinforcement-Learning, das durch eine „Denken-Sprechen-Entscheiden"-Pipeline numerische Daten mit sprachlicher Analyse verbindet und in Wirtschaftssimulationen signifikant bessere Ergebnisse als herkömmliche MARL- oder reine LLM-Ansätze erzielt.

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning

Der Artikel stellt Video2Layout vor, ein Framework, das mithilfe von kontinuierlichen Objektgrenzkoordinaten und einem zweistufigen Feinabstimmungsprozess metrisch fundierte räumliche Layouts aus Videos rekonstruiert, um die Fähigkeiten von Multimodalen Large Language Models zur räumlichen推理 im Vergleich zu diskretisierten Gitterkarten signifikant zu verbessern.

Yibin Huang, Wang Xu, Wanyue Zhang, Helu Zhi, Jingjing Huang, Yangbin Xu, Yangang Sun, Conghui Zhu, Tiejun Zhao2026-03-10💻 cs

Learning to Think Fast and Slow for Visual Language Models

Die Arbeit stellt DualMindVLM vor, ein visuelles Sprachmodell, das durch eine adaptive Dual-System-Architektur und GRPO-basiertes Training die natürliche Tendenz von Modellen zu unterschiedlich langen Antworten nutzt, um bei komplexen Aufgaben tiefgründiges Nachdenken mit effizienten, schnellen Reaktionen bei einfachen Fragen zu verbinden und dabei sowohl die Leistung als auch die Token-Effizienz zu maximieren.

Chenyu Lin, Cheng Chi, Jinlin Wu, Sharon Li, Kaiyang Zhou2026-03-10💻 cs

Radiative-Structured Neural Operator for Continuous and Extrapolative Spectral Super-Resolution

Die vorgestellte Arbeit stellt den Radiative-Structured Neural Operator (RSNO) vor, einen neuartigen Ansatz zur kontinuierlichen spektralen Super-Auflösung, der physikalische Strahlungsprinzipien und eine mehrstufige Architektur nutzt, um realistischere hyperspektrale Bilder aus multispektralen Beobachtungen zu rekonstruieren und dabei Farbverzerrungen zu minimieren.

Ziye Zhang, Bin Pan, Zhenwei Shi2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Die Arbeit stellt Yo'City vor, ein neuartiges agentic Framework, das mithilfe von Large Language Models eine personalisierte, hierarchisch geplante und unendlich erweiterbare Generierung realistischer 3D-Stadtlandschaften ermöglicht und dabei bestehende Methoden in allen Bewertungskriterien übertrifft.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

Das Paper stellt DOPD vor, ein dynamisches System zur Entkopplung von Prefill- und Decoding-Phasen bei LLM-Inferenz, das durch lastabhängige Ressourcenanpassung und optimierte Scheduling-Strategien die Systemeffizienz und die Einhaltung von Service-Level-Zielen im Vergleich zu bestehenden Ansätzen wie vLLM und DistServe signifikant verbessert.

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

Diese Arbeit stellt ein von einem Large Language Model unterstütztes Multi-Agenten-Framework vor, das den Entwurf und die Anpassung von Regelsystemen für Roll-zu-Roll-Fertigungsanlagen automatisiert, um durch iterative Simulation-zu-Realität-Adaption und Sicherheitsverifikation die Produktqualität zu gewährleisten und den manuellen Aufwand für die Inbetriebnahme zu reduzieren.

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

Diese Arbeit stellt einen Ansatz vor, der einen kausalen Foundation-Modell in ein präskriptives Wartungsframework integriert, um durch die Simulation von „Was-wäre-wenn"-Szenarien auf Produktionslinien die Ursachen von Ausfällen zu identifizieren und die Gesamtanlageneffektivität (OEE) durch datengestützte Handlungsempfehlungen zu optimieren.

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA

Die Arbeit stellt CAEC vor, ein System, das auf der Arm Confidential Compute Architecture (CCA) aufbaut und durch die Einführung von vertraulichem gemeinsam genutztem Speicher (CSM) eine effiziente, attesterbare und isolierte Datenübertragung zwischen Confidential Virtual Machines ermöglicht, ohne dass die Hypervisor-Ebene Zugriff hat.

Sina Abdollahi, Amir Al Sadi, Marios Kogias, David Kotz, Hamed Haddadi2026-03-10💻 cs