cs.AI Arbeiten | Gist.Science

VDCook:DIY video data cook your MLLMs

Das Paper stellt VDCook vor, ein selbstentwickelndes Video-Daten-Betriebssystem, das Forschern und Domänenteams ermöglicht, durch natürliche Sprachabfragen und automatisierte Retrieval- sowie Syntheseprozesse dynamisch aktualisierbare, metadatenreiche Videodatensätze für das Training von Multimodalen Large Language Models (MLLMs) zu erstellen.

Chengwei Wu2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Diese Arbeit untersucht die durch KI-Entwicklungen ausgelösten Herausforderungen und Chancen für die Mensch-Daten-Interaktion, indem sie bestehende Grenzen in Bezug auf Unsicherheit, Skalierbarkeit und Interpretierbarkeit aufzeigt und einen Paradigmenwechsel hin zu kognitiv und wahrnehmungsorientierten, menschzentrierten Systemen für die Datenanalyse fordert.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Die Arbeit stellt EigenData vor, eine selbstentwickelnde Multi-Agenten-Plattform, die den gesamten Lebenszyklus von Daten für Funktionsaufrufe automatisiert und durch die Korrektur des BFCL-V3-Tests sowie die Einführung einer ergebnisorientierten Evaluierung die Übereinstimmung zwischen Modellrankings und menschlichen Bewertungen der funktionalen Korrektheit signifikant verbessert.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed ⓘ🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Die Studie zeigt, dass der Continuous-Time Koopman Autoencoder (CT-KAE) als leichtgewichtiges Ersatzmodell für die langfristige Vorhersage von Ozeanzuständen in einem zweischichtigen quasigeostrophischen System eine stabile und effiziente Alternative zu autoregressiven Transformer-Baselines darstellt, indem er nichtlineare Dynamiken in einen linearen latenten Raum projiziert und dabei über lange Zeiträume hinweg stabile Fehlerwachstumsraten sowie konsistente großskalige Statistiken gewährleistet.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

Model Change for Description Logic Concepts

Die Arbeit untersucht das Problem der Modelländerung für Beschreibungslogikkonzepte, indem sie die Operationen Eviction, Reception und Revision formal definiert und die Kompatibilität dieser Ansätze für die Logiken EL und ALC analysiert, wobei gezeigt wird, dass Revision nicht einfach als Kombination von Eviction und Reception aufgefasst werden kann.

Ana Ozaki, Jandson S. Ribeiro2026-03-09🤖 cs.AI

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Die Arbeit entwickelt ein theoretisches Modell, das zeigt, wie generative KI zwar individuelle Fertigkeiten angleicht, aber durch die Verlagerung von Wertschöpfung auf konzentrierte komplementäre Vermögenswerte zu zwei unterschiedlichen Regimen der Ungleichheit führen kann, wobei die endgültige Wirkung von der Technologiearchitektur und den Arbeitsmarktinstitutionen abhängt.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Die Arbeit stellt CBR-to-SQL vor, ein auf Fallbasiertem Schließen (CBR) basierendes Framework, das durch eine zweistufige Abrufstrategie und abstrakte Fallvorlagen die Genauigkeit und Robustheit von Text-zu-SQL-Übersetzungen im medizinischen Bereich im Vergleich zu herkömmlichen RAG-Ansätzen signifikant verbessert.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

Die Arbeit stellt PRISM vor, eine Methode, die Imitationslernen und verstärkendes Lernen durch nutzerdefinierte Anweisungen und menschliches Feedback kombiniert, um Roboter-Manipulationsfähigkeiten effizient zu verfeinern und an neue Zielkonfigurationen anzupassen.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent

Das Paper stellt Tool-Genesis vor, ein diagnostisches Benchmark, das die Fähigkeit von Sprachagenten bewertet, aus abstrakten Anforderungen eigenständig Werkzeuge zu erstellen, und zeigt dabei, dass selbst fortschrittliche Modelle in einer One-Shot-Situation oft durch kleine Fehler in Schnittstellen und Logik scheitern, die sich im gesamten Prozesskette zu einem starken Leistungsabfall verstärken.

Bowei Xia, Mengkang Hu, Shijian Wang, Jiarui Jin, Wenxiang Jiao, Yuan Lu, Kexin Li, Ping Luo2026-03-09🤖 cs.AI

Spatiotemporal Heterogeneity of AI-Driven Traffic Flow Patterns and Land Use Interaction: A GeoAI-Based Analysis of Multimodal Urban Mobility

Diese Studie entwickelt ein GeoAI-Hybrid-Framework, das MGWR, Random Forest und ST-GCN integriert, um die nichtlinearen Wechselwirkungen zwischen Landnutzung und multimodalen Verkehrsflüssen in verschiedenen städtischen Morphologien präzise zu modellieren und dabei die Bedeutung des städtebaulichen Kontexts für die Verkehrsplanung unterstreicht.

Olaf Yunus Laitinen Imanov2026-03-09🤖 cs.AI

On the Value of Tokeniser Pretraining in Physics Foundation Models

Die Studie zeigt, dass das Vor-Training von Tokenisern für Physik-Foundation-Modelle die Recheneffizienz und Genauigkeit erheblich steigert, insbesondere wenn das Vor-Training auf demselben physikalischen System wie die nachgelagerte Aufgabe erfolgt.

Hadi Sotoudeh, Payel Mukhopadhyay, Ruben Ohana, Michael McCabe, Neil D. Lawrence, Shirley Ho, Miles Cranmer2026-03-09🔭 astro-ph

DreamCAD: Scaling Multi-modal CAD Generation using Differentiable Parametric Surfaces

Das Paper stellt DreamCAD vor, ein multimodales Generierungsframework, das durch die Darstellung von BReps als differentierbare parametrische Flächen und die Nutzung der neuen CADCap-1M-Datensammlung skalierbares, bearbeitbares CAD-Design aus unannotierten 3D-Meshes und Texten erzeugt und dabei den State-of-the-Art in geometrischer Genauigkeit und Benutzerpräferenz übertrifft.

Mohammad Sadil Khan, Muhammad Usama, Rolandos Alexandros Potamias, Didier Stricker, Muhammad Zeshan Afzal, Jiankang Deng, Ismail Elezi2026-03-09🤖 cs.AI

Real-Time AI Service Economy: A Framework for Agentic Computing Across the Continuum

Der Artikel stellt ein hybrides Management-System für die Echtzeit-KI-Service-Ökonomie vor, das nachweist, wie die Topologie von Abhängigkeitsgraphen die Stabilität dezentraler Ressourcenallokation bestimmt und durch die Kapselung komplexer Subgraphen in ressourcenschonende Schnittstellen die Preisvolatilität signifikant reduziert, ohne die Effizienz zu beeinträchtigen.

Lauri Lovén, Alaa Saleh, Reza Farahani, Ilir Murturi, Miguel Bordallo López, Praveen Kumar Donta, Schahram Dustdar2026-03-09🤖 cs.AI

RACAS: Controlling Diverse Robots With a Single Agentic System

Die Studie stellt RACAS vor, ein roboteragnostisches Agentic-System, das mittels natürlicher Sprache und großer Sprachmodelle diverse Roboterplattformen ohne Anpassung des Quellcodes steuern kann und so die Hürden für die Prototypenentwicklung senkt.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

Adversarial Batch Representation Augmentation for Batch Correction in High-Content Cellular Screening

Dieses Paper stellt ABRA vor, eine neue Methode zur Batch-Korrektur in der Hochdurchsatz-Zellbildanalyse, die das Problem als Domänen-Generalisierung formuliert und durch adversäres Lernen sowie geometrische Randbedingungen robuste Merkmalsdarstellungen für die Klassifizierung von siRNA-Perturbationen erzeugt.

Lei Tong, Xujing Yao, Adam Corrigan, Long Chen, Navin Rathna Kumar, Kerry Hallbrook, Jonathan Orme, Yinhai Wang, Huiyu Zhou2026-03-09🤖 cs.AI

Post Fusion Bird's Eye View Feature Stabilization for Robust Multimodal 3D Detection

Die Arbeit stellt den „Post Fusion Stabilizer" (PFS) vor, einen leichten Modul, der die Robustheit bestehender multimodaler 3D-Erkennungssysteme gegenüber Domänenverschiebungen und Sensoreffekten verbessert, ohne deren Architektur grundlegend zu verändern oder neu trainieren zu müssen.

Trung Tien Dong, Dev Thakkar, Arman Sargolzaei, Xiaomin Lin2026-03-09🤖 cs.AI

Relational Semantic Reasoning on 3D Scene Graphs for Open World Interactive Object Search

Die Arbeit stellt SCOUT vor, eine effiziente Methode zur interaktiven Objektsuche in offenen Welten, die durch die Suche in 3D-Szenengraphen und eine procedurale Distillation von LLM-Wissen in leichte Modelle eine Echtzeit-Leistung bei hoher semantischer Generalisierung ermöglicht, was durch das neue Benchmark SymSearch und reale Experimente validiert wird.

Imen Mahdi, Matteo Cassinelli, Fabien Despinoy, Tim Welschehold, Abhinav Valada2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

Die Studie zeigt, dass moralische Urteile von Large Language Models durch narrative Perspektiven und Prompt-Strukturen stark manipuliert werden können, was zu erheblicher Instabilität und Reproduzierbarkeitsproblemen führt, insbesondere bei moralisch mehrdeutigen Fällen.

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

The DSA's Blind Spot: Algorithmic Audit of Advertising and Minor Profiling on TikTok

Diese Studie zeigt durch einen algorithmischen Audit von TikTok auf, dass die aktuelle Definition von „Werbung" im Digital Services Act (DSA) eine regulatorische Lücke darstellt, die es ermöglicht, dass personalisierte Influencer- und Marketinginhalte trotz des Verbots von profilbasierten Werbeanzeigen für Minderjährige weiterhin wirksam an diese Zielgruppe ausgespielt werden.

Sara Solarova, Matej Mosnar, Matus Tibensky, Jan Jakubcik, Adrian Bindas, Simon Liska, Filip Hossner, Matúš Mesarčík, Ivan Srba2026-03-09🤖 cs.AI

When Rubrics Fail: Error Enumeration as Reward in Reference-Free RL Post-Training for Virtual Try-On

Die Arbeit stellt Implicit Error Counting (IEC) vor, eine Referenz-freie Reinforcement-Learning-Methode, die durch die Zählung und Gewichtung von Fehlern anstelle der Verwendung von Rubriken effektiv Post-Training für virtuelle Anproben optimiert, wo ideale Referenzantworten nicht verfügbar sind.

Wisdom Ikezogwo, Mehmet Saygin Seyfioglu, Ranjay Krishna, Karim Bouyarmane2026-03-09🤖 cs.AI

← Zurück Weiter →