Why Human Guidance Matters in Collaborative Vibe Coding

Die Studie zeigt, dass bei der kollaborativen „Vibe Coding"-Programmierung menschliche Führung durch übergeordnete Anweisungen entscheidend für den Erfolg ist, während rein KI-gesteuerte Ansätze oft scheitern und hybride Modelle am besten funktionieren, wenn Menschen die Anleitung übernehmen und die KI die Evaluierung durchführt.

Haoyu Hu, Raja Marjieh, Katherine M Collins, Chenyi Li, Thomas L. Griffiths, Ilia Sucholutsky, Nori Jacoby2026-03-09🤖 cs.AI

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

Das Paper stellt SWE-MiniSandbox vor, eine leichte, containerfreie Methode zur skalierbaren Reinforcement-Learning-Training von Software-Engineering-Agenten, die durch Kernel-isolierte Workspaces und Pre-Caching-Techniken den Speicherbedarf und die Vorbereitungszeit im Vergleich zu herkömmlichen Container-Ansätzen drastisch reduziert, ohne die Leistung zu beeinträchtigen.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

The Consensus Trap: Dissecting Subjectivity and the "Ground Truth" Illusion in Data Annotation

Diese Studie widerlegt die Illusion einer objektiven „Ground Truth" in der Datenannotation, indem sie aufzeigt, wie systematische Verzerrungen und der Druck zur Konsensbildung menschliche Meinungsverschiedenheiten als Rauschen unterdrücken, und fordert stattdessen eine pluralistische Infrastruktur, die kulturelle Vielfalt als essenzielles Signal anerkennt.

Sheza Munir, Benjamin Mah, Krisha Kalsi, Shivani Kapania, Julian Posada, Edith Law, Ding Wang, Syed Ishtiaque Ahmed2026-03-09🤖 cs.AI

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Die Studie stellt AHSIV vor, einen adaptiven Rahmen zur Auswahl von Prognosemodellen, der durch die Berücksichtigung von Horizont-induzierter Degradation und Nachfrageschwankungen die Instabilität bei der Modellbewertung über verschiedene Zeithorizonte hinweg adressiert und so robuste Entscheidungen für heterogene Nachfragemuster ermöglicht.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

IntelliAsk: Learning to Ask High-Quality Research Questions via RLVR

Das Paper stellt IntelliAsk vor, ein Modell, das durch Bestärkendes Lernen mit einer speziell entwickelten Belohnungsfunktion (IntelliReward) und einem optimierten Trainingsverfahren (DAPO) hochwertige, evidenzbasierte Forschungsfragen generiert, die menschlichen Gutachterstandards entsprechen und gleichzeitig die allgemeinen Fähigkeiten des Modells verbessern.

Karun Sharma, Vidushee Vats, Shengzhi Li, Yuxiang Wang, Zhongtian Sun, Prayag Tiwari2026-03-09🤖 cs.AI

CoME: Empowering Channel-of-Mobile-Experts with Informative Hybrid-Capabilities Reasoning

Die Arbeit stellt CoME vor, ein neuartiges Agenten-Architekturkonzept, das durch spezialisierte Experten, eine progressive Trainingsstrategie und einen informationsgeleiteten DPO-Ansatz die hybriden Reasoning-Fähigkeiten mobiler Agenten für eine präzisere Aufgabenausführung verbessert.

Yuxuan Liu, Weikai Xu, Kun Huang, Changyu Chen, Jiankun Zhao, Pengzhi Gao, Wei Liu, Jian Luan, Shuo Shang, Bo Du, Ji-Rong Wen, Rui Yan2026-03-09🤖 cs.AI

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Dieses Papier stellt eine reparametrisierte Tensor-Ring-Funktionalzerlegung vor, die mittels impliziter neuronaler Darstellungen und einer frequenzbasierten Analyse sowohl diskrete als auch kontinuierliche multidimensionale Daten effizient rekonstruiert und dabei in Aufgaben wie Bildinpainting und Punktwolkenwiederherstellung überlegene Ergebnisse erzielt.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

How Well Does Agent Development Reflect Real-World Work?

Die Studie zeigt, dass die aktuelle Entwicklung von KI-Agenten durch eine starke Programmierzentriertheit gekennzeichnet ist, die nicht mit der Verteilung menschlicher Arbeit und des wirtschaftlichen Werts im US-Arbeitsmarkt übereinstimmt, und schlägt darauf aufbauend Prinzipien für aussagekräftigere Benchmarks vor.

Zora Zhiruo Wang, Sanidhya Vijayvargiya, Aspen Chen, Hanmo Zhang, Venu Arvind Arangarajan, Jett Chen, Valerie Chen, Diyi Yang, Daniel Fried, Graham Neubig2026-03-09🤖 cs.AI

Multimodal Mixture-of-Experts with Retrieval Augmentation for Protein Active Site Identification

Die Arbeit stellt MERA vor, ein neuartiges retrieval-augmentiertes Framework, das durch einen hierarchischen Multi-Expert-Ansatz und eine auf der Dempster-Shafer-Theorie basierende, zuverlässigkeitsbewusste Fusionsstrategie den State-of-the-Art bei der Identifizierung von Protein-Aktivstellen erreicht.

Jiayang Wu, Jiale Zhou, Rubo Wang, Xingyi Zhang, Xun Lin, Tianxu Lv, Leong Hou U, Yefeng Zheng2026-03-09🤖 cs.AI

"When to Hand Off, When to Work Together": Expanding Human-Agent Co-Creative Collaboration through Concurrent Interaction

Die Studie stellt CLEO vor, ein System, das menschliche und KI-Agenten durch die Echtzeit-Interpretation paralleler Aktionen auf gemeinsamen Artefakten befähigt, dynamisch zwischen Delegation, Steuerung und gleichzeitiger Zusammenarbeit zu wechseln, um so die Grenzen der aktuellen Mensch-Agenten-Kollaboration zu überwinden.

Kihoon Son, Hyewon Lee, DaEun Choi, Yoonsu Kim, Tae Soo Kim, Yoonjoo Lee, John Joon Young Chung, HyunJoon Jung, Juho Kim2026-03-09🤖 cs.AI