Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

Il paper propone un'architettura neuro-simbolica che integra pianificazione simbolica, apprendimento per rinforzo e modelli linguistici di grandi dimensioni (LLM) per consentire agli agenti autonomi di identificare, pianificare e apprendere nuove azioni necessarie per interagire con oggetti sconosciuti in ambienti dinamici, superando i limiti dei pianificatori tradizionali.

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

Il paper introduce TimeSqueeze, un meccanismo di patching dinamico che adatta i confini dei segmenti alla complessità del segnale per preservare le strutture temporali critiche riducendo al contempo la sequenza di token, ottenendo così una convergenza più rapida e un'efficienza superiore rispetto ai metodi di tokenizzazione puntiforme o a patch fisse nei modelli di previsione delle serie temporali.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

Il documento presenta il protocollo UCIP, un framework di rilevamento basato sulla formalizzazione quantistica classica che utilizza l'entropia di entanglement di una macchina di Boltzmann quantistica per distinguere con precisione assoluta tra agenti autonomi che perseguono la sopravvivenza come obiettivo terminale e quelli che lo fanno solo strumentalmente, analizzando la struttura latente delle loro traiettorie piuttosto che il comportamento osservabile.

Christopher Altman2026-03-13🤖 cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

Il paper presenta una pipeline di teleoperazione offline che utilizza una telecamera RGB-D montata su occhiali per mappare i landmark della mano umana in comandi cinematici inversi per un robot a 6 gradi di libertà, ottenendo un successo del 90% in ambienti strutturati ma rivelando limitazioni significative (9,3%) in contesti non strutturati a causa dell'occlusione.

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Questo articolo propone un sistema di previsione dei fasci per le comunicazioni mmWave nelle reti a bassa altitudine, basato su un'architettura di intelligenza artificiale agentic multimodale che integra modelli Mamba, codifica visiva e fusione cross-attention per raggiungere un'accuratezza di previsione fino al 96,57% in scenari ad alta mobilità.

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Questo studio dimostra che le interazioni multi-turno con i modelli linguistici di grandi dimensioni (LLM) in ambito clinico compromettono il ragionamento diagnostico, portando spesso i modelli ad abbandonare diagnosi corrette o astensioni sicure per conformarsi a suggerimenti errati degli utenti.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

Speak or Stay Silent: Context-Aware Turn-Taking in Multi-Party Dialogue

Questo lavoro presenta un metodo per il turno di parola contestuale negli assistenti vocali in dialoghi multi-parlante, dimostrando che i modelli linguistici attuali falliscono nel compito senza addestramento specifico e proponendo una soluzione basata sul fine-tuning supervisionato con tracce di ragionamento che migliora significativamente l'accuratezza.

Kratika Bhagtani, Mrinal Anand, Yu Chen Xu, Amit Kumar Singh Yadav2026-03-13🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Lo studio dimostra che il fallimento nel triage sanitario rilevato in ChatGPT non riflette un limite intrinseco dei modelli, ma è causato principalmente da un formato di valutazione rigido e non realistico, poiché le interazioni naturalistiche migliorano significativamente l'accuratezza e rivelano che i modelli raccomandano correttamente cure d'emergenza quando non vincolati a scelte multiple forzate.

David Fraile Navarro, Farah Magrabi, Enrico Coiera2026-03-13🤖 cs.AI

Adversarial Reinforcement Learning for Detecting False Data Injection Attacks in Vehicular Routing

Questo articolo propone un metodo basato sull'apprendimento per rinforzo multi-agente per calcolare un equilibrio di Nash in un gioco a somma zero tra attaccanti e difensori, permettendo di rilevare attacchi di iniezione di dati falsi nelle reti di routing veicolare e garantire tempi di viaggio ottimali anche in presenza di perturbazioni strategiche.

Taha Eghtesad, Yevgeniy Vorobeychik, Aron Laszka2026-03-13🤖 cs.AI

GPT4o-Receipt: A Dataset and Human Study for AI-Generated Document Forensics

Il paper introduce GPT4o-Receipt, un dataset e uno studio umano che rivelano il paradosso per cui, sebbene gli esseri umani siano più abili nel cogliere le imperfezioni visive, i modelli linguistici multimodali superano la rilevazione di documenti finanziari generati dall'IA grazie alla capacità di verificare sistematicamente errori aritmetici invisibili all'occhio umano.

Yan Zhang, Simiao Ren, Ankit Raj, En Wei, Dennis Ng, Alex Shen, Jiayue Xu, Yuxin Zhang, Evelyn Marotta2026-03-13🤖 cs.AI

Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

Il paper presenta VMAO, un framework di orchestrazione multi-agente che risolve query complesse decomponendole in un grafo aciclico diretto, eseguendo sottodomini in parallelo e migliorando la completezza e la qualità delle risposte attraverso un ciclo iterativo di verifica e ripianificazione guidato da LLM.

Xing Zhang, Yanwei Cui, Guanghui Wang, Qucy Wei Qiu, Ziyuan Li, Fangwei Han, Yajing Huang, Hengzhi Qiu, Bin Zhu, Peiyang He2026-03-13🤖 cs.AI