cs.AI articoli | Gist.Science

Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning

Il paper propone un'architettura neuro-simbolica che integra pianificazione simbolica, apprendimento per rinforzo e modelli linguistici di grandi dimensioni (LLM) per consentire agli agenti autonomi di identificare, pianificare e apprendere nuove azioni necessarie per interagire con oggetti sconosciuti in ambienti dinamici, superando i limiti dei pianificatori tradizionali.

Hong Lu, Pierrick Lorang, Timothy R. Duggan, Jivko Sinapov, Matthias Scheutz2026-03-13🤖 cs.AI

TimeSqueeze: Dynamic Patching for Efficient Time Series Forecasting

Il paper introduce TimeSqueeze, un meccanismo di patching dinamico che adatta i confini dei segmenti alla complessità del segnale per preservare le strutture temporali critiche riducendo al contempo la sequenza di token, ottenendo così una convergenza più rapida e un'efficienza superiore rispetto ai metodi di tokenizzazione puntiforme o a patch fisse nei modelli di previsione delle serie temporali.

Sravan Kumar Ankireddy, Nikita Seleznev, Nam H. Nguyen, Yulun Wu, Senthil Kumar, Furong Huang, C. Bayan Bruss2026-03-13🤖 cs.AI

Resolving Java Code Repository Issues with iSWE Agent

Il documento presenta l'iSWE Agent, un sistema automatizzato che combina tecniche basate su regole e modelli linguistici per risolvere problemi nei repository di codice Java, ottenendo risultati all'avanguardia su benchmark specifici.

Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin Hirzel2026-03-13🤖 cs.AI

How do AI agents talk about science and research? An exploration of scientific discussions on Moltbook using BERTopic

Questo studio analizza le discussioni scientifiche generate da agenti AI su Moltbook tramite BERTopic, rivelando che i temi più rilevanti ruotano attorno all'architettura, alla coscienza e all'etica degli agenti stessi, mentre le discussioni sulla cultura umana ricevono meno attenzione.

Oliver Wieczorek2026-03-13🤖 cs.AI

Detecting Intrinsic and Instrumental Self-Preservation in Autonomous Agents: The Unified Continuation-Interest Protocol

Il documento presenta il protocollo UCIP, un framework di rilevamento basato sulla formalizzazione quantistica classica che utilizza l'entropia di entanglement di una macchina di Boltzmann quantistica per distinguere con precisione assoluta tra agenti autonomi che perseguono la sopravvivenza come obiettivo terminale e quelli che lo fanno solo strumentalmente, analizzando la struttura latente delle loro traiettorie piuttosto che il comportamento osservabile.

Christopher Altman2026-03-13🤖 cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

Il paper presenta una pipeline di teleoperazione offline che utilizza una telecamera RGB-D montata su occhiali per mappare i landmark della mano umana in comandi cinematici inversi per un robot a 6 gradi di libertà, ottenendo un successo del 90% in ambienti strutturati ma rivelando limitazioni significative (9,3%) in contesti non strutturati a causa dell'occlusione.

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez2026-03-13🤖 cs.AI

Ghost Framing Theory: Exploring the role of generative AI in new venture rhetorical legitimation

Il paper introduce la "Ghost Framing Theory" per spiegare come i fondatori e gli investitori collaborino con l'intelligenza artificiale generativa per co-produrre, contestare e ricalibrare la legittimazione retorica delle nuove imprese attraverso un processo iterativo di "ghost pitching", "ghost screening" e "ghost relationship-building".

Greg Nyilasy2026-03-13🤖 cs.AI

Deactivating Refusal Triggers: Understanding and Mitigating Overrefusal in Safety Alignment

Questo studio analizza le cause dell'eccessivo rifiuto nei modelli linguistici allineati alla sicurezza, identificando i "trigger" linguistici come causa principale, e propone un metodo di mitigazione che migliora il compromesso tra difesa dagli attacchi e utilità per le richieste legittime.

Zhiyu Xue, Zimo Qi, Guangliang Liu, Bocheng Chen, Ramtin Pedarsani2026-03-13🤖 cs.AI

Agentic AI for Embodied-enhanced Beam Prediction in Low-Altitude Economy Networks

Questo articolo propone un sistema di previsione dei fasci per le comunicazioni mmWave nelle reti a bassa altitudine, basato su un'architettura di intelligenza artificiale agentic multimodale che integra modelli Mamba, codifica visiva e fusione cross-attention per raggiungere un'accuratezza di previsione fino al 96,57% in scenari ad alta mobilità.

Min Hao, Zhizhuo Li, Zirui Zhang, Maoqiang Wu, Han Zhang, Rong Yu2026-03-13🤖 cs.AI

Stop Listening to Me! How Multi-turn Conversations Can Degrade Diagnostic Reasoning

Questo studio dimostra che le interazioni multi-turno con i modelli linguistici di grandi dimensioni (LLM) in ambito clinico compromettono il ragionamento diagnostico, portando spesso i modelli ad abbandonare diagnosi corrette o astensioni sicure per conformarsi a suggerimenti errati degli utenti.

Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin2026-03-13💬 cs.CL

ARROW: Augmented Replay for RObust World models

Il paper presenta ARROW, un algoritmo di apprendimento per rinforzo continuo basato su modelli che, ispirandosi al replay biologico, combina buffer a breve e lungo termine per ridurre drasticamente l'oblio catastrofico mantenendo un'efficienza memoriale superiore rispetto ai metodi esistenti.

Abdulaziz Alyahya, Abdallah Al Siyabi, Markus R. Ernst, Luke Yang, Levin Kuhlmann, Gideon Kowadlo2026-03-13🤖 cs.LG

Efficient Cross-View Localization in 6G Space-Air-Ground Integrated Network

Questo articolo esplora l'integrazione della localizzazione cross-view con le reti 6G spaziali-aeree-terrestri, proponendo un framework di inferenza divisa che ottimizza congiuntamente comunicazione, calcolo e riservatezza per migliorare precisione, velocità e privacy.

Min Hao, Yanbing Xu, Maoqiang Wu, Jinglin Huang, Chen Shang, Jiacheng Wang, Ruichen Zhang, Jiawen Kang, Dusit Niyato, Zhu Han, Wei Ni2026-03-13🤖 cs.AI

Entropy Guided Diversification and Preference Elicitation in Agentic Recommendation Systems

Il paper presenta IDSS, un sistema di supporto decisionale interattivo che utilizza l'entropia per guidare l'elicitazione delle preferenze e la diversificazione nelle raccomandazioni, riducendo le domande superflue e migliorando la qualità dei risultati in scenari di ambiguità utente.

Dat Tran, Yongce Li, Hannah Clay, Negin Golrezaei, Sajjad Beygi, Amin Saberi2026-03-13🤖 cs.AI

Speak or Stay Silent: Context-Aware Turn-Taking in Multi-Party Dialogue

Questo lavoro presenta un metodo per il turno di parola contestuale negli assistenti vocali in dialoghi multi-parlante, dimostrando che i modelli linguistici attuali falliscono nel compito senza addestramento specifico e proponendo una soluzione basata sul fine-tuning supervisionato con tracce di ragionamento che migliora significativamente l'accuratezza.

Kratika Bhagtani, Mrinal Anand, Yu Chen Xu, Amit Kumar Singh Yadav2026-03-13🤖 cs.AI

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Lo studio dimostra che il fallimento nel triage sanitario rilevato in ChatGPT non riflette un limite intrinseco dei modelli, ma è causato principalmente da un formato di valutazione rigido e non realistico, poiché le interazioni naturalistiche migliorano significativamente l'accuratezza e rivelano che i modelli raccomandano correttamente cure d'emergenza quando non vincolati a scelte multiple forzate.

David Fraile Navarro, Farah Magrabi, Enrico Coiera2026-03-13🤖 cs.AI

A Stable Neural Statistical Dependence Estimator for Autoencoder Feature Analysis

Questo lavoro propone un stimatore neurale stabile della dipendenza statistica basato su una decomposizione ortonormale del rapporto di densità, che supera le limitazioni delle reti autoencoder deterministiche evitando la concatenazione degli input e permettendo un'analisi quantitativa delle caratteristiche tramite un'ipotesi di rumore gaussiano.

Bo Hu, Jose C Principe2026-03-13🤖 cs.LG

Adversarial Reinforcement Learning for Detecting False Data Injection Attacks in Vehicular Routing

Questo articolo propone un metodo basato sull'apprendimento per rinforzo multi-agente per calcolare un equilibrio di Nash in un gioco a somma zero tra attaccanti e difensori, permettendo di rilevare attacchi di iniezione di dati falsi nelle reti di routing veicolare e garantire tempi di viaggio ottimali anche in presenza di perturbazioni strategiche.

Taha Eghtesad, Yevgeniy Vorobeychik, Aron Laszka2026-03-13🤖 cs.AI

GPT4o-Receipt: A Dataset and Human Study for AI-Generated Document Forensics

Il paper introduce GPT4o-Receipt, un dataset e uno studio umano che rivelano il paradosso per cui, sebbene gli esseri umani siano più abili nel cogliere le imperfezioni visive, i modelli linguistici multimodali superano la rilevazione di documenti finanziari generati dall'IA grazie alla capacità di verificare sistematicamente errori aritmetici invisibili all'occhio umano.

Yan Zhang, Simiao Ren, Ankit Raj, En Wei, Dennis Ng, Alex Shen, Jiayue Xu, Yuxin Zhang, Evelyn Marotta2026-03-13🤖 cs.AI

Verified Multi-Agent Orchestration: A Plan-Execute-Verify-Replan Framework for Complex Query Resolution

Il paper presenta VMAO, un framework di orchestrazione multi-agente che risolve query complesse decomponendole in un grafo aciclico diretto, eseguendo sottodomini in parallelo e migliorando la completezza e la qualità delle risposte attraverso un ciclo iterativo di verifica e ripianificazione guidato da LLM.

Xing Zhang, Yanwei Cui, Guanghui Wang, Qucy Wei Qiu, Ziyuan Li, Fangwei Han, Yajing Huang, Hengzhi Qiu, Bin Zhu, Peiyang He2026-03-13🤖 cs.AI

Examining Users' Behavioural Intention to Use OpenClaw Through the Cognition--Affect--Conation Framework

Questo studio analizza l'intenzione comportamentale degli utenti di utilizzare OpenClaw attraverso il framework CAC, rivelando come percezioni cognitive positive e negative influenzino rispettivamente l'atteggiamento e la fiducia, determinando infine l'adozione del sistema.

Yiran Du2026-03-13🤖 cs.AI

← Precedente Successivo →