From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Basierend auf einer Designstudie mit erfahrenen Forschern stellt das Paper ARC vor, ein integriertes System, das durch Multi-Datenbank-Integration, transparente iterative Suche und verifizierbare KI-Unterstützung die kognitive Belastung bei systematischen Literaturübersichten reduziert und Forscher von administrativen Aufgaben hin zu strategischer Exploration befähigt.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Die Arbeit stellt „Traversal-as-Policy" vor, eine Methode, bei der aus erfolgreichen OpenHands-Executions-Logs ein ausführbarer, gate-gesteuerter Verhaltensbaum abgeleitet wird, der als externe, überprüfbare Richtlinie dient und damit die Erfolgsrate von LLM-Agenten signifikant steigert, während Sicherheitsverletzungen nahezu eliminiert und die Kosten gesenkt werden.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

Der Paper stellt Omni-C vor, einen einzigen dichten Transformer-Encoder, der durch unimodales kontrastives Vor-Training auf großen unalignierten Daten heterogene Modalitäten wie Bilder, Audio und Text effizient in gemeinsamen Repräsentationen vereint und dabei den Bedarf an Mixture-of-Expert-Architekturen, gepaarter Überwachung oder Routing-Overhead eliminiert.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Die Studie zeigt, dass das KI-Modell Boltz-2 zwar für das schnelle Vorab-Screening nützlich ist, jedoch aufgrund unzureichender energetischer Korrelationen und struktureller Unsicherheiten keine verlässliche Alternative zu physikbasierten Methoden für die präzise Identifizierung von Wirkstoffkandidaten darstellt.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Diese Arbeit untersucht die durch KI-Entwicklungen ausgelösten Herausforderungen und Chancen für die Mensch-Daten-Interaktion, indem sie bestehende Grenzen in Bezug auf Unsicherheit, Skalierbarkeit und Interpretierbarkeit aufzeigt und einen Paradigmenwechsel hin zu kognitiv und wahrnehmungsorientierten, menschzentrierten Systemen für die Datenanalyse fordert.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Die Arbeit stellt EigenData vor, eine selbstentwickelnde Multi-Agenten-Plattform, die den gesamten Lebenszyklus von Daten für Funktionsaufrufe automatisiert und durch die Korrektur des BFCL-V3-Tests sowie die Einführung einer ergebnisorientierten Evaluierung die Übereinstimmung zwischen Modellrankings und menschlichen Bewertungen der funktionalen Korrektheit signifikant verbessert.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed 🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Die Studie zeigt, dass der Continuous-Time Koopman Autoencoder (CT-KAE) als leichtgewichtiges Ersatzmodell für die langfristige Vorhersage von Ozeanzuständen in einem zweischichtigen quasigeostrophischen System eine stabile und effiziente Alternative zu autoregressiven Transformer-Baselines darstellt, indem er nichtlineare Dynamiken in einen linearen latenten Raum projiziert und dabei über lange Zeiträume hinweg stabile Fehlerwachstumsraten sowie konsistente großskalige Statistiken gewährleistet.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Die Arbeit entwickelt ein theoretisches Modell, das zeigt, wie generative KI zwar individuelle Fertigkeiten angleicht, aber durch die Verlagerung von Wertschöpfung auf konzentrierte komplementäre Vermögenswerte zu zwei unterschiedlichen Regimen der Ungleichheit führen kann, wobei die endgültige Wirkung von der Technologiearchitektur und den Arbeitsmarktinstitutionen abhängt.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent

Das Paper stellt Tool-Genesis vor, ein diagnostisches Benchmark, das die Fähigkeit von Sprachagenten bewertet, aus abstrakten Anforderungen eigenständig Werkzeuge zu erstellen, und zeigt dabei, dass selbst fortschrittliche Modelle in einer One-Shot-Situation oft durch kleine Fehler in Schnittstellen und Logik scheitern, die sich im gesamten Prozesskette zu einem starken Leistungsabfall verstärken.

Bowei Xia, Mengkang Hu, Shijian Wang, Jiarui Jin, Wenxiang Jiao, Yuan Lu, Kexin Li, Ping Luo2026-03-09🤖 cs.AI