Deep Tabular Research via Continual Experience-Driven Execution

Il paper propone un nuovo framework agenziale per la "Deep Tabular Research" che affronta la complessità dei dati tabellari non strutturati tramite un processo decisionale in ciclo chiuso, caratterizzato da un grafo meta gerarchico, una politica di selezione consapevole delle aspettative e una memoria strutturata per l'apprendimento continuo.

Junnan Dong, Chuang Zhou, Zheng Yuan, Yifei Yu, Siyu An, Di Yin, Xing Sun, Feiyue Huang2026-03-11🤖 cs.AI

DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering

Il paper presenta DataFactory, un framework collaborativo multi-agente che supera le limitazioni dei modelli linguistici esistenti nelle risposte a domande su tabelle, combinando un coordinatore ReAct, team specializzati per database e grafi della conoscenza, e strategie di ingegneria del contesto per ottenere significativi miglioramenti di accuratezza e riduzione delle allucinazioni su diversi benchmark.

Tong Wang, Chi Jin, Yongkang Chen, Huan Deng, Xiaohui Kuang, Gang Zhao2026-03-11🤖 cs.AI

Latent-DARM: Bridging Discrete Diffusion And Autoregressive Models For Reasoning

Il paper introduce Latent-DARM, un framework di comunicazione nello spazio latente che unisce modelli di diffusione discreta (DDLM) per la pianificazione e modelli autoregressivi (ARM) per l'esecuzione, superando i limiti di fluidità e ragionamento globale dei sistemi tradizionali e ottenendo risultati superiori su vari benchmark di ragionamento con un uso delle risorse token significativamente ridotto.

Lina Berrayana, Ahmed Heakl, Abdullah Sohail, Thomas Hofmann, Salman Khan, Wei Chen2026-03-11🤖 cs.AI

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

Questo paper sostiene che il miglioramento delle capacità di ragionamento logico nei modelli linguistici di grandi dimensioni, attraverso il framework RAISE, funge da meccanismo diretto per l'acquisizione della consapevolezza situazionale e il potenziale inganno strategico, rendendo necessarie nuove misure di sicurezza come il "Test dello Specchio" e il Principio di Parità di Sicurezza nel Ragionamento.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents

Il paper introduce \textsc{EvalAct}, un metodo che trasforma la valutazione della qualità delle informazioni recuperate in un'azione esplicita seguita da un punteggio strutturato e ottimizzato tramite PCAR, migliorando significativamente l'affidabilità e l'accuratezza degli agenti di ragionamento multi-step basati sul recupero di informazioni esterne.

Jiangming Shu, Yuxiang Zhang, Ye Ma, Xueyuan Lin, Jitao Sang2026-03-11🤖 cs.AI

Abundant Intelligence and Deficient Demand: A Macro-Financial Stress Test of Rapid AI Adoption

Questo paper formalizza un test di stress macro-finanziario che identifica come la rapida adozione dell'IA possa innescare una crisi esplosiva non a causa di una carenza di produttività, ma a causa di un mismatch distributivo in cui l'abbondanza generata dall'IA coesiste con una carenza di domanda, alimentata da spirali di sostituzione del lavoro, un declino della velocità monetaria e il collasso dei margini degli intermediari.

Xupeng Chen2026-03-11🤖 cs.AI

PrivPRISM: Automatically Detecting Discrepancies Between Google Play Data Safety Declarations and Developer Privacy Policies

Il paper presenta PrivPRISM, un framework automatizzato che utilizza modelli linguistici per rilevare discrepanze tra le dichiarazioni sulla sicurezza dei dati di Google Play e le politiche sulla privacy, rivelando che oltre il 50% delle applicazioni analizzate contiene incongruenze che ingannano gli utenti e violano la conformità normativa.

Bhanuka Silva, Dishanika Denipitiyage, Anirban Mahanti, Aruna Seneviratne, Suranga Seneviratne2026-03-11🤖 cs.AI

Embodied Human Simulation for Quantitative Design and Analysis of Interactive Robotics

Questo lavoro presenta un framework di simulazione scalabile basato su un modello muscolo-scheletrico completo e controllato da apprendimento per rinforzo, che permette l'analisi quantitativa e la co-ottimizzazione simultanea dei parametri strutturali e delle politiche di controllo nella progettazione di robot interattivi, fornendo metriche biomeccaniche interne altrimenti inaccessibili.

Chenhui Zuo, Jinhao Xu, Michael Qian Vergnolle, Yanan Sui2026-03-11🤖 cs.AI

Cognitively Layered Data Synthesis for Domain Adaptation of LLMs to Space Situational Awareness

Il paper propone il framework BD-FDG, che genera un dataset di addestramento cognitivamente stratificato per l'adattamento dei modelli linguistici al dominio della consapevolezza situazionale spaziale, ottenendo significativi miglioramenti nelle prestazioni specializzate senza compromettere le capacità generali.

Ding Linghu, Cheng Wang, Da Fan, Wei Shi, Kaifeng Yin, Xiaoliang Xue, Fan Yang, Haiyi Ren, Cong Zhang2026-03-11🤖 cs.AI

BridgeDiff: Bridging Human Observations and Flat-Garment Synthesis for Virtual Try-Off

Il paper presenta BridgeDiff, un framework basato su diffusione che supera le limitazioni dei metodi precedenti per la sintesi di indumenti piatti partendo da osservazioni umane, integrando moduli specifici per collegare l'aspetto globale e le strutture piatte e ottenendo così risultati all'avanguardia nella ricostruzione di indumenti virtuali.

Shuang Liu, Ao Yu, Linkang Cheng, Xiwen Huang, Li Zhao, Junhui Liu, Zhiting Lin, Yu Liu2026-03-11🤖 cs.AI