cs.AI articoli | Gist.Science

Can LLM Aid in Solving Constraints with Inductive Definitions?

Questo lavoro propone un approccio neuro-simbolico che integra i Large Language Models con i solutori di vincoli per generare iterativamente lemma ausiliari, migliorando significativamente la capacità di risolvere vincoli contenenti definizioni induttive rispetto agli strumenti esistenti.

Weizhi Feng, Shidong Shen, Jiaxiang Liu, Taolue Chen, Fu Song, Zhilin Wu2026-03-09🤖 cs.AI

Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Questo studio empirico, basato su un'analisi tematica di diari retrospettivi e interviste a esperti, identifica quattro temi chiave riguardanti la governance, il perfezionamento iterativo, i vincoli operativi e la collaborazione uomo-AI per colmare le lacune nella definizione dei ruoli e dei meccanismi di feedback nelle applicazioni di Intelligenza Artificiale.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

An Embodied Companion for Visual Storytelling

Il paper presenta "Companion", un sistema artistico che integra un robot disegnatore con modelli linguistici di grandi dimensioni per trasformare la collaborazione uomo-macchina in una co-creazione sinergica di narrazioni visive, la cui qualità estetica e valore espositivo sono stati validati da esperti del settore.

Patrick Tresset, Markus Wulfmeier2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Questo studio presenta ARC, un sistema progettato per ridurre il carico cognitivo nelle revisioni sistematiche della letteratura integrando più database e un'IA trasparente, facilitando così il passaggio degli ricercatori dalla gestione amministrativa all'esplorazione strategica.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Il paper propone "Traversal-as-Policy", un metodo che distilla i log di esecuzione in un Gated Behavior Tree eseguibile per trasformare la navigazione dell'albero in una politica di controllo verificabile, migliorando significativamente il successo, la sicurezza e l'efficienza degli agenti LLM autonomi su benchmark complessi.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

Il paper introduce RoboLayout, un'estensione di LayoutVLM che genera scene 3D semanticamente coerenti e fisicamente fattibili per agenti incarnati, integrando vincoli di raggiungibilità differenziabili e una fase di raffinamento locale per ottimizzare la disposizione degli oggetti in base alle capacità fisiche specifiche dell'agente.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Molecular Representations for AI in Chemistry and Materials Science: An NLP Perspective

Questo articolo offre una guida alle rappresentazioni digitali delle molecole ispirate all'elaborazione del linguaggio naturale (NLP) e alle relative applicazioni basate sull'intelligenza artificiale, fungendo da risorsa fondamentale per i ricercatori che operano all'intersezione tra chimica, scienza dei materiali e informatica.

Sanjanasri JP, Pratiti Bhadra, N. Sukumar, Soman KP2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

Il paper presenta Omni-C, un singolo encoder denso basato su Transformer che comprime modalità eterogenee (immagini, audio e testo) in rappresentazioni condivise tramite pre-addestramento contrastivo, eliminando la necessità di architetture Mixture-of-Experts e riducendo significativamente l'uso di memoria rispetto ai modelli multimodali tradizionali.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

Towards Neural Graph Data Management

Il paper introduce NGDBench, un benchmark unificato che valuta le capacità dei modelli neurali nella gestione di dati grafici strutturati supportando l'intero linguaggio di query Cypher, rivelando significative limitazioni negli attuali LLM e metodi RAG nel ragionamento strutturato e nella robustezza al rumore.

Yufei Li, Yisen Gao, Jiaxin Bai, Jiaxuan Xiong, Haoyu Huang, Zhongwei Xie, Hong Ting Tsang, Yangqiu Song2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Lo studio valuta Boltz-2, un modello di fondazione biomolecolare, su due grandi dataset e conclude che, sebbene offra velocità per lo screening iniziale, manca della risoluzione energetica necessaria per l'identificazione di candidati farmacologici, rendendo indispensabili i metodi basati sulla fisica per garantire affidabilità e raffinamento.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

Il paper presenta JAWS, una strategia di regolarizzazione probabilistica che modula dinamicamente il vincolo di stabilità in base alla complessità fisica locale, permettendo ai modelli di operatori neurali di mantenere la stabilità a lungo termine e la fedeltà delle caratteristiche singolari (come gli shock) senza compromettere le regioni lisce, superando così i limiti delle tecniche di regolarizzazione globale.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

Il paper presenta VDCook, un sistema operativo auto-evolutivo per la costruzione dinamica e personalizzata di dataset video tramite query in linguaggio naturale, che integra recupero e sintesi controllata per abbattere le barriere all'addestramento di modelli multimediali in domini specifici.

Chengwei Wu2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Questo articolo esamina come i rapidi progressi dell'IA, in particolare i modelli fondazionali, stiano ridefinendo le interazioni uomo-dati e l'analisi visiva, evidenziando le nuove sfide legate all'incertezza e alla scalabilità e proponendo un approccio centrato sull'umano che integri principi cognitivi e percettivi per superare i limiti dei paradigmi esistenti.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Il paper presenta EigenData, una piattaforma multi-agente auto-evolutiva che automatizza la sintesi, l'audit e la riparazione dei dati per il function calling, migliorando significativamente la correlazione tra le valutazioni dei modelli e il giudizio umano sulla correttezza funzionale attraverso la correzione del benchmark BFCL-V3 e l'introduzione di metriche basate sullo stato del database.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed ⓘ🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Il documento presenta il Continuous-Time Koopman Autoencoder (CT-KAE) come un modello surrogato leggero e stabile per le previsioni oceaniche a lungo termine, che supera le limitazioni di instabilità e deriva energetica dei modelli basati su Transformer garantendo un'evoluzione temporale strutturata e un'inferenza estremamente rapida.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

Model Change for Description Logic Concepts

Il paper introduce il concetto di "model change" per le logiche descrittive, distinguendo tra evizione, ricezione e revisione, e analizza i risultati teorici sulla loro compatibilità e sulla natura non riducibile della revisione nelle logiche EL e ALC.

Ana Ozaki, Jandson S. Ribeiro2026-03-09🤖 cs.AI

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Questo studio teorizza come l'IA generativa, pur omogeneizzando le competenze individuali, possa paradossalmente ampliare la disuguaglianza aggregata spostando il valore economico verso asset concentrati, definendo due regimi di disuguaglianza la cui dinamica dipende dalla struttura tecnologica dell'IA e dalle istituzioni del mercato del lavoro.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Il paper introduce CBR-to-SQL, un framework basato sul ragionamento per casi che supera le limitazioni dei metodi RAG tradizionali nel dominio sanitario, ottenendo risultati all'avanguardia nella traduzione da testo a SQL su dati EHR grazie a un processo di recupero a due stadi che migliora l'efficienza e la robustezza anche in condizioni di scarsità di dati.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

PRISM: Personalized Refinement of Imitation Skills for Manipulation via Human Instructions

Il paper presenta PRISM, un metodo che combina apprendimento per imitazione e rinforzo guidato da istruzioni umane per affinare le politiche di manipolazione robotica, migliorandone la robustezza e l'efficienza dei dati attraverso correzioni intermedie e la generazione iterativa di funzioni di ricompensa.

Arnau Boix-Granell, Alberto San-Miguel-Tello, Magí Dalmau-Moreno, Néstor García2026-03-09🤖 cs.AI

Tool-Genesis: A Task-Driven Tool Creation Benchmark for Self-Evolving Language Agent

Il paper presenta Tool-Genesis, un benchmark diagnostico che valuta la capacità degli agenti linguistici di creare e utilizzare strumenti autonomamente da requisiti astratti, rivelando come le imperfezioni iniziali nei modelli più avanzati compromettano drasticamente le prestazioni a valle.

Bowei Xia, Mengkang Hu, Shijian Wang, Jiarui Jin, Wenxiang Jiao, Yuan Lu, Kexin Li, Ping Luo2026-03-09🤖 cs.AI

← Precedente Successivo →