cs.AI articoli | Gist.Science

Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment

Questo articolo propone l'approccio TS4NAP, che utilizza la similarità tra tassonomie mediche (ICD-10-CM e ICD-10-PCS) e il matching di grafi per migliorare e rendere spiegabile la previsione del prossimo passo terapeutico nei processi di cura dei pazienti, valutata su dati del dataset MIMIC-IV.

Martin Kuhn, Joscha Grüger, Tobias Geyer + 1 more2026-03-05🤖 cs.AI

Safety Guardrails for LLM-Enabled Robots

Il paper propone RoboGuard, un'architettura di sicurezza a due stadi che combina un LLM di "fiducia radice" per generare specifiche di sicurezza contestualizzate e la sintesi di controllo logico temporale per garantire che i robot abilitati ai grandi modelli linguistici (LLM) operino in modo sicuro, riducendo drasticamente l'esecuzione di piani pericolosi senza comprometterne le prestazioni.

Zachary Ravichandran, Alexander Robey, Vijay Kumar + 2 more2026-03-05🤖 cs.AI

OSCAR: Online Soft Compression And Reranking

Il paper introduce OSCAR, un metodo innovativo di compressione soft online e dipendente dalla query che riduce l'overhead computazionale e accelera l'inferenza nei sistemi RAG senza comprometterne l'accuratezza, integrando anche una funzionalità di riclassificazione.

Maxime Louis, Thibault Formal, Hervé Dejean + 1 more2026-03-05🤖 cs.AI

MuRAL: A Multi-Resident Ambient Sensor Dataset Annotated with Natural Language for Activities of Daily Living

Il paper presenta MuRAL, un nuovo dataset di sensori ambientali per attività quotidiane in ambienti multi-abitanti arricchito da descrizioni in linguaggio naturale, che evidenzia le attuali limitazioni dei modelli linguistici di grandi dimensioni nel gestire l'assegnazione degli utenti, la descrizione delle azioni e la classificazione delle attività in scenari complessi.

Xi Chen, Julien Cumin, Fano Ramparany + 1 more2026-03-05🤖 cs.AI

Synthetic emotions and consciousness: exploring architectural boundaries

Questo articolo propone un'architettura di controllo emotivo modulare e biologicamente ispirata che, soddisfacendo otto principi progettuali e quattro vincoli di riduzione del rischio (come l'assenza di broadcast globale e metarappresentazione), dimostra la fattibilità di implementare comportamenti simili alle emozioni escludendo deliberatamente le caratteristiche architettoniche associate alla coscienza di accesso, offrendo così un modello teorico e strumenti pratici per la governance e la sicurezza dei sistemi artificiali.

Hermann Borotschnig2026-03-05🤖 cs.AI

When Your Own Output Becomes Your Training Data: Noise-to-Meaning Loops and a Formal RSI Trigger

Il documento presenta il modello formale N2M-RSI, che dimostra come un agente AI che utilizza i propri output come dati di addestramento possa generare una crescita illimitata della complessità interna una volta superata una specifica soglia di integrazione informativa, unificando concetti di auto-prompting e riferimento godeliano in un framework agnostico rispetto all'implementazione.

Rintaro Ando2026-03-05🤖 cs.AI

TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility

Il paper propone TPK, un metodo per la previsione di traiettorie nel guida autonoma che integra conoscenze a priori specifiche per diverse classi di agenti (veicoli, pedoni, ciclisti) per garantire previsioni fisicamente fattibili e interpretabili, migliorando così l'affidabilità rispetto ai modelli esistenti.

Marius Baden, Ahmed Abouelazm, Christian Hubschneider + 3 more2026-03-05🤖 cs.AI

Emotion-Gradient Metacognitive RSI (Part I): Theoretical Foundations and Single-Agent Architecture

Questo articolo presenta le fondamenta teoriche e l'architettura di un singolo agente del framework EG-MRSI, un sistema innovativo che integra metacognizione, motivazione intrinseca basata sulle emozioni e auto-modifica ricorsiva per guidare lo sviluppo verso un'AGI aperta e sicura.

Rintaro Ando2026-03-05🤖 cs.AI

Unsupervised Representation Learning - an Invariant Risk Minimization Perspective

Gli autori propongono un nuovo framework di apprendimento non supervisionato per la Minimizzazione del Rischio Invariante (IRM) che, attraverso i metodi PICA e VIAE, allinea le distribuzioni delle caratteristiche per apprendere rappresentazioni robuste e generalizzabili tra diversi ambienti senza fare affidamento su dati etichettati.

Yotam Norman, Ron Meir2026-03-05✓ Author reviewed ⓘ🤖 cs.AI

TSPulse: Tiny Pre-Trained Models with Disentangled Representations for Rapid Time-Series Analysis

TSPulse è una famiglia di modelli pre-addestrati ultra-leggeri che, grazie a rappresentazioni disaccoppiate in domini temporali, spettrali e semantici, supera le prestazioni di modelli molto più grandi su diverse attività di diagnostica delle serie temporali abilitando un trasferimento zero-shot efficiente e un deployment senza GPU.

Vijay Ekambaram, Subodh Kumar, Arindam Jati + 5 more2026-03-05🤖 cs.AI

Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation

Questo lavoro propone "Feature Mixing", un metodo semplice e veloce per la sintesi di outlier multimodali che, insieme al nuovo dataset CARLA-OOD, raggiunge prestazioni all'avanguardia nella rilevazione e segmentazione di dati fuori distribuzione con un significativo aumento di velocità rispetto alle tecniche esistenti.

Moru Liu, Hao Dong, Jessica Kelly + 2 more2026-03-05🤖 cs.AI

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

Il paper presenta SafeDPO, un metodo leggero e teoricamente fondato che ottimizza direttamente la sicurezza dei modelli linguistici senza reward model o campionamento online, ottenendo eccellenti compromessi tra sicurezza e utilità su benchmark come PKU-SafeRLHF-30K.

Geon-Hyeong Kim, Yu Jin Kim, Byoungjip Kim + 4 more2026-03-05🤖 cs.AI

RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models

Il paper propone RLJP, un framework per la previsione delle sentenze legali che combina la formalizzazione della logica del primo ordine con l'apprendimento contrastivo confuso per creare un meccanismo di adattamento dinamico che supera i limiti di rigidità dei modelli esistenti, ottenendo risultati superiori su dataset pubblici.

Yue Zhang, Zhiliang Tian, Shicheng Zhou + 7 more2026-03-05🤖 cs.AI

R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning

Il paper presenta R1-Code-Interpreter, un modello LLM potenziato da un approccio di apprendimento curricolare multi-fase che combina fine-tuning supervisionato e rinforzato, permettendo di generare codice autonomamente e raggiungendo prestazioni superiori rispetto a GPT-4o su una vasta gamma di compiti di ragionamento e pianificazione.

Yongchao Chen, Yueying Liu, Junwei Zhou + 5 more2026-03-05🤖 cs.AI

Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning

Il paper propone la Calibrazione Supervisionata (SC), un nuovo framework basato sulla minimizzazione della perdita che supera i limiti delle tecniche di calibrazione esistenti per l'Apprendimento in Contesto (ICL) nei LLM, permettendo di modificare l'orientamento dei confini decisionali e integrando regolarizzatori per migliorare la stabilità e le prestazioni su diversi modelli e dataset.

Korel Gundem, Juncheng Dong, Dennis Zhang + 2 more2026-03-05🤖 cs.AI

AutoQD: Automatic Discovery of Diverse Behaviors with Quality-Diversity Optimization

Il paper presenta AutoQD, un metodo che automatizza la scoperta di comportamenti diversificati negli algoritmi di ottimizzazione Qualità-Diversità generando descrittori comportamentali basati sulle misure di occupazione delle politiche, eliminando così la necessità di definire manualmente tali descrittori.

Saeed Hedayatian, Stefanos Nikolaidis2026-03-05🤖 cs.AI

Robust Adversarial Quantification via Conflict-Aware Evidential Deep Learning

Il paper presenta C-EDL, un approccio post-hoc leggero per l'incertezza che, sfruttando trasformazioni diversificate e la misurazione del disaccordo rappresentazionale, migliora significativamente la robustezza e la rilevazione di dati fuori distribuzione o avversari nei modelli di Deep Learning Evidenziale senza richiedere un nuovo addestramento.

Charmaine Barker, Daniel Bethell, Simos Gerasimou2026-03-05🤖 cs.AI

LeanTutor: Towards a Verified AI Mathematical Proof Tutor

Il paper presenta LeanTutor, un sistema di tutoraggio matematico basato sull'IA che combina le capacità comunicative dei modelli linguistici con la correttezza verificabile dei prover di teoremi Lean, valutato tramite il nuovo dataset PeanoBench.

Manooshree Patel, Rayna Bhattacharyya, Thomas Lu + 4 more2026-03-05🤖 cs.AI

VFEFL: Privacy-Preserving Federated Learning against Malicious Clients via Verifiable Functional Encryption

Il documento presenta VFEFL, un framework di apprendimento federato che utilizza una nuova schema di crittografia funzionale verificabile decentralizzata (CC-DVFE) per garantire privacy, robustezza contro client malevoli e verificabilità senza dipendere da assunzioni di server non colludenti o terze parti fidate.

Nina Cai, Jinguang Han, Weizhi Meng2026-03-05🤖 cs.AI

EgoWorld: Translating Exocentric View to Egocentric View using Rich Exocentric Observations

Il paper introduce EgoWorld, un nuovo framework che ricostruisce una visione in prima persona a partire da osservazioni esocentriche ricche (come nuvole di punti, pose 3D delle mani e descrizioni testuali) superando i limiti dei metodi attuali e ottenendo prestazioni all'avanguardia su diversi dataset.

Junho Park, Andrew Sangwoo Ye, Taein Kwon2026-03-05🤖 cs.AI

← Precedente Successivo →