cs.AI Arbeiten | Gist.Science

Can LLM Aid in Solving Constraints with Inductive Definitions?

Die vorgestellte Arbeit demonstriert, dass ein neuro-symbolischer Ansatz, der Large Language Models zur Generierung von Hilfslemmata mit Constraint-Lösern kombiniert, die Erfolgsrate beim Lösen von Induktionsdefinitionen um etwa 25 % gegenüber dem aktuellen Stand der Technik steigert.

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu2026-03-09🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Diese Studie leitet aus einer qualitativen Analyse von Chatbot-Entwicklungsdaten und Experteninterviews vier zentrale Themenbereiche ab, um die oft fragmentierte operative Gestaltung von Human-in-the-Loop-Prinzipien im gesamten Lebenszyklus von KI-Anwendungen zu präzisieren.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

An Embodied Companion for Visual Storytelling

Die Arbeit stellt „Companion" vor, ein robotisches Zeichensystem, das durch die Integration von Large Language Models und Echtzeit-Interaktion den Menschen wieder in den kreativen Prozess einbindet und so eine synergistische, bidirektionale Zusammenarbeit für das visuelle Geschichtenerzählen ermöglicht, die von Experten als ästhetisch eigenständig und ausstellungsfähig bestätigt wurde.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Basierend auf einer Designstudie mit erfahrenen Forschern stellt das Paper ARC vor, ein integriertes System, das durch Multi-Datenbank-Integration, transparente iterative Suche und verifizierbare KI-Unterstützung die kognitive Belastung bei systematischen Literaturübersichten reduziert und Forscher von administrativen Aufgaben hin zu strategischer Exploration befähigt.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Die Arbeit stellt „Traversal-as-Policy" vor, eine Methode, bei der aus erfolgreichen OpenHands-Executions-Logs ein ausführbarer, gate-gesteuerter Verhaltensbaum abgeleitet wird, der als externe, überprüfbare Richtlinie dient und damit die Erfolgsrate von LLM-Agenten signifikant steigert, während Sicherheitsverletzungen nahezu eliminiert und die Kosten gesenkt werden.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

Das Paper stellt RoboLayout vor, eine Erweiterung von LayoutVLM, die durch die Integration expliziter Erreichbarkeitsbeschränkungen und einer lokalen Verfeinerung differenzierbare 3D-Layouts für embodied Agents generiert, die sowohl semantisch kohärent als auch physisch für diverse Agenten wie Roboter oder Menschen navigierbar und handhabbar sind.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective

Diese Arbeit bietet aus der Perspektive der natürlichen Sprachverarbeitung (NLP) einen Überblick über gängige digitale Molekülrepräsentationen und deren Anwendungen in der chemischen Informatik, um Forschern als Leitfaden an der Schnittstelle von KI, Chemie und Materialwissenschaft zu dienen.

Sanjanasri JP, Pratiti Bhadra, N. Sukumar, Soman KP2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

Der Paper stellt Omni-C vor, einen einzigen dichten Transformer-Encoder, der durch unimodales kontrastives Vor-Training auf großen unalignierten Daten heterogene Modalitäten wie Bilder, Audio und Text effizient in gemeinsamen Repräsentationen vereint und dabei den Bedarf an Mixture-of-Expert-Architekturen, gepaarter Überwachung oder Routing-Overhead eliminiert.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

Towards Neural Graph Data Management

Die Arbeit stellt NGDBench vor, ein umfassendes Benchmark-System, das die Fähigkeiten neuronaler Modelle bei der Verarbeitung komplexer Graphdatenbanken mittels der Cypher-Abfragesprache bewertet und dabei erhebliche Defizite in Bezug auf strukturiertes Schlussfolgern und Rauschrobustheit aufzeigt.

Yufei Li, Yisen Gao, Jiaxin Bai, Jiaxuan Xiong, Haoyu Huang, Zhongwei Xie, Hong Ting Tsang, Yangqiu Song2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Die Studie zeigt, dass das KI-Modell Boltz-2 zwar für das schnelle Vorab-Screening nützlich ist, jedoch aufgrund unzureichender energetischer Korrelationen und struktureller Unsicherheiten keine verlässliche Alternative zu physikbasierten Methoden für die präzise Identifizierung von Wirkstoffkandidaten darstellt.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

Die Arbeit stellt JAWS vor, eine probabilistische Regularisierungsmethode, die durch räumlich adaptive Jacobian-Regulierung die Langzeitstabilität und Genauigkeit von neuronalen Operatoren bei der Simulation dynamischer Systeme verbessert, indem sie Kontraktion in glatten Regionen mit der Erhaltung von Gradienten an Singularitäten kombiniert.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

Das Paper stellt VDCook vor, ein selbstentwickelndes Video-Daten-Betriebssystem, das Forschern und Domänenteams ermöglicht, durch natürliche Sprachabfragen und automatisierte Retrieval- sowie Syntheseprozesse dynamisch aktualisierbare, metadatenreiche Videodatensätze für das Training von Multimodalen Large Language Models (MLLMs) zu erstellen.

Chengwei Wu2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Diese Arbeit untersucht die durch KI-Entwicklungen ausgelösten Herausforderungen und Chancen für die Mensch-Daten-Interaktion, indem sie bestehende Grenzen in Bezug auf Unsicherheit, Skalierbarkeit und Interpretierbarkeit aufzeigt und einen Paradigmenwechsel hin zu kognitiv und wahrnehmungsorientierten, menschzentrierten Systemen für die Datenanalyse fordert.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Die Arbeit stellt EigenData vor, eine selbstentwickelnde Multi-Agenten-Plattform, die den gesamten Lebenszyklus von Daten für Funktionsaufrufe automatisiert und durch die Korrektur des BFCL-V3-Tests sowie die Einführung einer ergebnisorientierten Evaluierung die Übereinstimmung zwischen Modellrankings und menschlichen Bewertungen der funktionalen Korrektheit signifikant verbessert.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed ⓘ🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Die Studie zeigt, dass der Continuous-Time Koopman Autoencoder (CT-KAE) als leichtgewichtiges Ersatzmodell für die langfristige Vorhersage von Ozeanzuständen in einem zweischichtigen quasigeostrophischen System eine stabile und effiziente Alternative zu autoregressiven Transformer-Baselines darstellt, indem er nichtlineare Dynamiken in einen linearen latenten Raum projiziert und dabei über lange Zeiträume hinweg stabile Fehlerwachstumsraten sowie konsistente großskalige Statistiken gewährleistet.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

Model Change for Description Logic Concepts

Die Arbeit untersucht das Problem der Modelländerung für Beschreibungslogikkonzepte, indem sie die Operationen Eviction, Reception und Revision formal definiert und die Kompatibilität dieser Ansätze für die Logiken EL und ALC analysiert, wobei gezeigt wird, dass Revision nicht einfach als Kombination von Eviction und Reception aufgefasst werden kann.

Ana Ozaki, Jandson S. Ribeiro2026-03-09🤖 cs.AI

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Die Arbeit entwickelt ein theoretisches Modell, das zeigt, wie generative KI zwar individuelle Fertigkeiten angleicht, aber durch die Verlagerung von Wertschöpfung auf konzentrierte komplementäre Vermögenswerte zu zwei unterschiedlichen Regimen der Ungleichheit führen kann, wobei die endgültige Wirkung von der Technologiearchitektur und den Arbeitsmarktinstitutionen abhängt.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Die Arbeit stellt CBR-to-SQL vor, ein auf Fallbasiertem Schließen (CBR) basierendes Framework, das durch eine zweistufige Abrufstrategie und abstrakte Fallvorlagen die Genauigkeit und Robustheit von Text-zu-SQL-Übersetzungen im medizinischen Bereich im Vergleich zu herkömmlichen RAG-Ansätzen signifikant verbessert.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

Die Arbeit stellt PRISM vor, eine Methode, die Imitationslernen und verstärkendes Lernen durch nutzerdefinierte Anweisungen und menschliches Feedback kombiniert, um Roboter-Manipulationsfähigkeiten effizient zu verfeinern und an neue Zielkonfigurationen anzupassen.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent

Das Paper stellt Tool-Genesis vor, ein diagnostisches Benchmark, das die Fähigkeit von Sprachagenten bewertet, aus abstrakten Anforderungen eigenständig Werkzeuge zu erstellen, und zeigt dabei, dass selbst fortschrittliche Modelle in einer One-Shot-Situation oft durch kleine Fehler in Schnittstellen und Logik scheitern, die sich im gesamten Prozesskette zu einem starken Leistungsabfall verstärken.

Bowei Xia, Mengkang Hu, Shijian Wang, Jiarui Jin, Wenxiang Jiao, Yuan Lu, Kexin Li, Ping Luo2026-03-09🤖 cs.AI

← Zurück Weiter →