Exploring Human-in-the-Loop Themes in AI Application Development: An Empirical Thematic Analysis

Questo studio empirico, basato su un'analisi tematica di diari retrospettivi e interviste a esperti, identifica quattro temi chiave riguardanti la governance, il perfezionamento iterativo, i vincoli operativi e la collaborazione uomo-AI per colmare le lacune nella definizione dei ruoli e dei meccanismi di feedback nelle applicazioni di Intelligenza Artificiale.

Parm Suksakul, Nathan Kittichaikoonkij, Nakhin Polthai, Aung Pyae2026-03-09🤖 cs.AI

From Toil to Thought: Designing for Strategic Exploration and Responsible AI in Systematic Literature Reviews

Questo studio presenta ARC, un sistema progettato per ridurre il carico cognitivo nelle revisioni sistematiche della letteratura integrando più database e un'IA trasparente, facilitando così il passaggio degli ricercatori dalla gestione amministrativa all'esplorazione strategica.

Runlong Ye, Naaz Sibia, Angela Zavaleta Bernuy, Tingting Zhu, Carolina Nobre, Viktoria Pammer-Schindler, Michael Liut2026-03-09🤖 cs.AI

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

Il paper propone "Traversal-as-Policy", un metodo che distilla i log di esecuzione in un Gated Behavior Tree eseguibile per trasformare la navigazione dell'albero in una politica di controllo verificabile, migliorando significativamente il successo, la sicurezza e l'efficienza degli agenti LLM autonomi su benchmark complessi.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Omni-C: Compressing Heterogeneous Modalities into a Single Dense Encoder

Il paper presenta Omni-C, un singolo encoder denso basato su Transformer che comprime modalità eterogenee (immagini, audio e testo) in rappresentazioni condivise tramite pre-addestramento contrastivo, eliminando la necessità di architetture Mixture-of-Experts e riducendo significativamente l'uso di memoria rispetto ai modelli multimodali tradizionali.

Kin Wai Lau, Yasar Abbas Ur Rehman, Lai-Man Po, Pedro Porto Buarque de Gusmão2026-03-09🤖 cs.AI

On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Lo studio valuta Boltz-2, un modello di fondazione biomolecolare, su due grandi dataset e conclude che, sebbene offra velocità per lo screening iniziale, manca della risoluzione energetica necessaria per l'identificazione di candidati farmacologici, rendendo indispensabili i metodi basati sulla fisica per garantire affidabilità e raffinamento.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney2026-03-09🤖 cs.AI

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

Il paper presenta JAWS, una strategia di regolarizzazione probabilistica che modula dinamicamente il vincolo di stabilità in base alla complessità fisica locale, permettendo ai modelli di operatori neurali di mantenere la stabilità a lungo termine e la fedeltà delle caratteristiche singolari (come gli shock) senza compromettere le regioni lisce, superando così i limiti delle tecniche di regolarizzazione globale.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

Human-Data Interaction, Exploration, and Visualization in the AI Era: Challenges and Opportunities

Questo articolo esamina come i rapidi progressi dell'IA, in particolare i modelli fondazionali, stiano ridefinendo le interazioni uomo-dati e l'analisi visiva, evidenziando le nuove sfide legate all'incertezza e alla scalabilità e proponendo un approccio centrato sull'umano che integri principi cognitivi e percettivi per superare i limiti dei paradigmi esistenti.

Jean-Daniel Fekete, Yifan Hu, Dominik Moritz, Arnab Nandi, Senjuti Basu Roy, Eugene Wu, Nikos Bikakis, George Papastefanatos, Panos K. Chrysanthis, Guoliang Li, Lingyun Yu2026-03-09🤖 cs.AI

EigenData: A Self-Evolving Multi-Agent Platform for Function-Calling Data Synthesis, Auditing, and Repair

Il paper presenta EigenData, una piattaforma multi-agente auto-evolutiva che automatizza la sintesi, l'audit e la riparazione dei dati per il function calling, migliorando significativamente la correlazione tra le valutazioni dei modelli e il giudizio umano sulla correttezza funzionale attraverso la correzione del benchmark BFCL-V3 e l'introduzione di metriche basate sullo stato del database.

Jiaao Chen, Jingyuan Qi, Mingye Gao, Wei-Chen Wang, Hanrui Wang, Di Jin2026-03-09✓ Author reviewed 🤖 cs.AI

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

Il documento presenta il Continuous-Time Koopman Autoencoder (CT-KAE) come un modello surrogato leggero e stabile per le previsioni oceaniche a lungo termine, che supera le limitazioni di instabilità e deriva energetica dei modelli basati su Transformer garantendo un'evoluzione temporale strutturata e un'inferenza estremamente rapida.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Il paper introduce CBR-to-SQL, un framework basato sul ragionamento per casi che supera le limitazioni dei metodi RAG tradizionali nel dominio sanitario, ottenendo risultati all'avanguardia nella traduzione da testo a SQL su dati EHR grazie a un processo di recupero a due stadi che migliora l'efficienza e la robustezza anche in condizioni di scarsità di dati.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI