Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Die Arbeit stellt Yo'City vor, ein neuartiges agentic Framework, das mithilfe von Large Language Models eine personalisierte, hierarchisch geplante und unendlich erweiterbare Generierung realistischer 3D-Stadtlandschaften ermöglicht und dabei bestehende Methoden in allen Bewertungskriterien übertrifft.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

Das Paper stellt DOPD vor, ein dynamisches System zur Entkopplung von Prefill- und Decoding-Phasen bei LLM-Inferenz, das durch lastabhängige Ressourcenanpassung und optimierte Scheduling-Strategien die Systemeffizienz und die Einhaltung von Service-Level-Zielen im Vergleich zu bestehenden Ansätzen wie vLLM und DistServe signifikant verbessert.

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

An LLM-Assisted Multi-Agent Control Framework for Roll-to-Roll Manufacturing Systems

Diese Arbeit stellt ein von einem Large Language Model unterstütztes Multi-Agenten-Framework vor, das den Entwurf und die Anpassung von Regelsystemen für Roll-zu-Roll-Fertigungsanlagen automatisiert, um durch iterative Simulation-zu-Realität-Adaption und Sicherheitsverifikation die Produktqualität zu gewährleisten und den manuellen Aufwand für die Inbetriebnahme zu reduzieren.

Jiachen Li, Shihao Li, Christopher Martin, Zijun Chen, Dongmei Chen, Wei Li2026-03-10💻 cs

Integrating a Causal Foundation Model into a Prescriptive Maintenance Framework for Optimising Production-Line OEE

Diese Arbeit stellt einen Ansatz vor, der einen kausalen Foundation-Modell in ein präskriptives Wartungsframework integriert, um durch die Simulation von „Was-wäre-wenn"-Szenarien auf Produktionslinien die Ursachen von Ausfällen zu identifizieren und die Gesamtanlageneffektivität (OEE) durch datengestützte Handlungsempfehlungen zu optimieren.

Felix Saretzky, Lucas Andersen, Thomas Engel, Fazel Ansari2026-03-10💻 cs

Confidential, Attestable, and Efficient Inter-CVM Communication with Arm CCA

Die Arbeit stellt CAEC vor, ein System, das auf der Arm Confidential Compute Architecture (CCA) aufbaut und durch die Einführung von vertraulichem gemeinsam genutztem Speicher (CSM) eine effiziente, attesterbare und isolierte Datenübertragung zwischen Confidential Virtual Machines ermöglicht, ohne dass die Hypervisor-Ebene Zugriff hat.

Sina Abdollahi, Amir Al Sadi, Marios Kogias, David Kotz, Hamed Haddadi2026-03-10💻 cs

MAViD: A Multimodal Framework for Audio-Visual Dialogue Understanding and Generation

Die Arbeit stellt MAViD vor, ein multimodales Framework mit einer Conductor-Creator-Architektur, das durch die Kombination von autoregressiven und Diffusionsmodellen sowie einem neuartigen Fusionsmodul realistische, langandauernde und multimodal konsistente Audio-Visual-Dialoge versteht und generiert.

Youxin Pang, Jiajun Liu, Lingfeng Tan, Yong Zhang, Feng Gao, Xiang Deng, Zhuoliang Kang, Xiaoming Wei, Yebin Liu2026-03-10💻 cs

When Token Pruning is Worse than Random: Understanding Visual Token Information in VLLMs

Diese Arbeit identifiziert das Phänomen des „Informationshorizonts", bei dem visuelle Token in tieferen Schichten von Vision Large Language Models ihre Relevanz verlieren, und zeigt, dass eine gezielte Kombination aus existierenden Pruning-Methoden und zufälliger Token-Entfernung in diesen tiefen Schichten die Effizienz steigert, ohne die Leistung signifikant zu beeinträchtigen.

Yahong Wang, Juncheng Wu, Zhangkai Ni, Longzhen Yang, Yihang Liu, Chengmei Yang, Ying Wen, Lianghua He, Xianfeng Tang, Hui Liu, Yuyin Zhou2026-03-10💻 cs

ReMeDI: Refined Memory for Disambiguation of Identities with SAM3 in Surgical Segmentation

Die Arbeit stellt ReMeDI-SAM3 vor, eine trainingsfreie Erweiterung von SAM3, die durch relevante Speicherfilterung, eine stückweise Interpolationsschema und ein identitätsbasiertes Re-Identifikationsmodul die Segmentierung chirurgischer Instrumente in Endoskopievideos auch bei Okklusionen und langen Unterbrechungen signifikant verbessert.

Valay Bundele, Mehran Hosseinzadeh, Hendrik P. A. Lensch2026-03-10💻 cs

It is not always greener on the other side: Greenery perception across demographics and personalities in multiple cities

Diese Studie zeigt, dass die Diskrepanz zwischen objektiv gemessener und subjektiv wahrgenommener städtischer Vegetation weltweit ähnlich ist und weniger von demografischen oder persönlichen Faktoren abhängt, sondern maßgeblich vom Wohnort der Betrachter geprägt wird, was kulturelle und erfahrungsbasierte Einflüsse auf die Grünwahrnehmung unterstreicht.

Matias Quintana, Fangqi Liu, Jussi Torkko, Youlong Gu, Xiucheng Liang, Yujun Hou, Koichi Ito, Yihan Zhu, Mahmoud Abdelrahman, Tuuli Toivonen, Yi Lu, Filip Biljecki2026-03-10💻 cs

VOIC: Visible-Occluded Integrated Guidance for 3D Semantic Scene Completion

Die Arbeit stellt VOIC vor, ein neuartiges Dual-Decoder-Framework für die monokulare 3D-semantische Szenenkompletion, das durch eine explizite Trennung von sichtbaren und verdeckten Regionen sowie eine integrierte Interaktion zwischen diesen die Genauigkeit bei der geometrischen Vervollständigung und semantischen Segmentierung in autonomen Fahrszenen signifikant verbessert.

Zaidao Han, Risa Higashita, Jiang Liu2026-03-10💻 cs

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

Diese Studie zeigt, dass bei Text-zu-SQL-Anwendungen in der Cloud Reasoning-Modelle trotz ähnlicher Genauigkeit signifikant kosteneffizienter sind als nicht-reasoning-Modelle, da die herkömmliche Optimierung nach Ausführungszeit nicht mit den tatsächlichen Verbrauchsgebühren korreliert und nicht-reasoning-Modelle durch ineffiziente Abfragen zu extremen Kostenvarianzen führen können.

Saurabh Deochake, Debajyoti Mukhopadhyay2026-03-10💻 cs