Safety Guardrails for LLM-Enabled Robots

Il paper propone RoboGuard, un'architettura di sicurezza a due stadi che combina un LLM di "fiducia radice" per generare specifiche di sicurezza contestualizzate e la sintesi di controllo logico temporale per garantire che i robot abilitati ai grandi modelli linguistici (LLM) operino in modo sicuro, riducendo drasticamente l'esecuzione di piani pericolosi senza comprometterne le prestazioni.

Zachary Ravichandran, Alexander Robey, Vijay Kumar + 2 more2026-03-05🤖 cs.AI

MuRAL: A Multi-Resident Ambient Sensor Dataset Annotated with Natural Language for Activities of Daily Living

Il paper presenta MuRAL, un nuovo dataset di sensori ambientali per attività quotidiane in ambienti multi-abitanti arricchito da descrizioni in linguaggio naturale, che evidenzia le attuali limitazioni dei modelli linguistici di grandi dimensioni nel gestire l'assegnazione degli utenti, la descrizione delle azioni e la classificazione delle attività in scenari complessi.

Xi Chen, Julien Cumin, Fano Ramparany + 1 more2026-03-05🤖 cs.AI

Synthetic emotions and consciousness: exploring architectural boundaries

Questo articolo propone un'architettura di controllo emotivo modulare e biologicamente ispirata che, soddisfacendo otto principi progettuali e quattro vincoli di riduzione del rischio (come l'assenza di broadcast globale e metarappresentazione), dimostra la fattibilità di implementare comportamenti simili alle emozioni escludendo deliberatamente le caratteristiche architettoniche associate alla coscienza di accesso, offrendo così un modello teorico e strumenti pratici per la governance e la sicurezza dei sistemi artificiali.

Hermann Borotschnig2026-03-05🤖 cs.AI

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

Il documento presenta il modello formale N2M-RSI, che dimostra come un agente AI che utilizza i propri output come dati di addestramento possa generare una crescita illimitata della complessità interna una volta superata una specifica soglia di integrazione informativa, unificando concetti di auto-prompting e riferimento godeliano in un framework agnostico rispetto all'implementazione.

Rintaro Ando2026-03-05🤖 cs.AI

TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility

Il paper propone TPK, un metodo per la previsione di traiettorie nel guida autonoma che integra conoscenze a priori specifiche per diverse classi di agenti (veicoli, pedoni, ciclisti) per garantire previsioni fisicamente fattibili e interpretabili, migliorando così l'affidabilità rispetto ai modelli esistenti.

Marius Baden, Ahmed Abouelazm, Christian Hubschneider + 3 more2026-03-05🤖 cs.AI

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

TSPulse è una famiglia di modelli pre-addestrati ultra-leggeri che, grazie a rappresentazioni disaccoppiate in domini temporali, spettrali e semantici, supera le prestazioni di modelli molto più grandi su diverse attività di diagnostica delle serie temporali abilitando un trasferimento zero-shot efficiente e un deployment senza GPU.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning

Il paper presenta R1-Code-Interpreter, un modello LLM potenziato da un approccio di apprendimento curricolare multi-fase che combina fine-tuning supervisionato e rinforzato, permettendo di generare codice autonomamente e raggiungendo prestazioni superiori rispetto a GPT-4o su una vasta gamma di compiti di ragionamento e pianificazione.

Yongchao Chen, Yueying Liu, Junwei Zhou + 5 more2026-03-05🤖 cs.AI

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Il paper propone la Calibrazione Supervisionata (SC), un nuovo framework basato sulla minimizzazione della perdita che supera i limiti delle tecniche di calibrazione esistenti per l'Apprendimento in Contesto (ICL) nei LLM, permettendo di modificare l'orientamento dei confini decisionali e integrando regolarizzatori per migliorare la stabilità e le prestazioni su diversi modelli e dataset.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI