cs.AI articoli | Gist.Science

Dissociating Direct Access from Inference in AI Introspection

Lo studio dimostra che i modelli di intelligenza artificiale rilevano le rappresentazioni iniettate attraverso due meccanismi distinti: un'inferenza basata sull'anomalia del prompt e un accesso diretto agli stati interni che, sebbene rilevi l'anomalia in modo agnostico rispetto al contenuto, non permette di identificare con precisione il significato semantico senza un significativo aumento dei token.

Harvey Lederman, Kyle Mahowald2026-03-06🤖 cs.AI

The Spatial and Temporal Resolution of Motor Intention in Multi-Target Prediction

Questo studio presenta una pipeline computazionale che, analizzando segnali EMG multicanale tramite algoritmi di apprendimento automatico, dimostra la possibilità di decodificare con elevata accuratezza l'intenzione motoria e la direzione del movimento verso 25 bersagli spaziali già nelle fasi precoci di pianificazione ed esecuzione, offrendo così un contributo fondamentale per lo sviluppo di sistemi riabilitativi adattivi e anticipatori.

Marie Dominique Schmidt, Ioannis Iossifidis2026-03-06🤖 cs.AI

MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

Il paper presenta MobileFetalCLIP, un modello studentesco leggero da 11,4 milioni di parametri che supera i fondamenti esistenti grazie a una nuova tecnica di distillazione della conoscenza repulsiva selettiva, consentendo l'analisi in tempo reale degli ultrasuoni fetali su dispositivi mobili con risorse limitate.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

RelaxFlow: Text-Driven Amodal 3D Generation

Il paper presenta RelaxFlow, un framework senza addestramento che risolve l'ambiguità semantica nella generazione 3D da testo sotto occlusione, utilizzando un meccanismo di rilassamento per completare le regioni nascoste rispettando sia l'osservazione originale che l'intento del prompt.

Jiayin Zhu, Guoji Fu, Xiaolu Liu + 3 more2026-03-06🤖 cs.AI

Ensembling Language Models with Sequential Monte Carlo

Questo lavoro introduce un quadro unificato per l'ensembling di modelli linguistici tramite distribuzioni $f$ -ensemble, utilizzando un algoritmo Sequential Monte Carlo a livello di byte per campionare coerentemente da distribuzioni aggregate anche con vocabolari diversi, superando i limiti delle tecniche di aggregazione tradizionali.

Robin Shing Moon Chan, Tianyu Liu, Samuel Kiegeland + 5 more2026-03-06🤖 cs.AI

SAIL: Similarity-Aware Guidance and Inter-Caption Augmentation-based Learning for Weakly-Supervised Dense Video Captioning

Il paper presenta SAIL, un metodo per la descrizione densa di video debolmente supervisionata che migliora la localizzazione temporale degli eventi generando maschere semanticamente consapevoli tramite allineamento cross-modale e arricchendo le annotazioni con caption sintetiche generate da LLM.

Ye-Chan Kim, SeungJu Cha, Si-Woo Kim + 3 more2026-03-06🤖 cs.AI

Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model

Il paper presenta CompACT, un tokenizzatore discreto che comprime le osservazioni in soli 8 token per abilitare una pianificazione rapida ed efficiente nei modelli del mondo, rendendoli pratici per il controllo in tempo reale.

Dongwon Kim, Gawon Seo, Jinsung Lee + 2 more2026-03-06🤖 cs.AI

Residual RL--MPC for Robust Microrobotic Cell Pushing Under Time-Varying Flow

Questo articolo propone un controller ibrido che combina un MPC nominale con una politica residua appresa tramite RL per migliorare la robustezza e l'accuratezza nella spinta di cellule microscopiche tramite un microrobot magnetico in flussi microfluidici variabili nel tempo.

Yanda Yang, Sambeeta Das2026-03-06🤖 cs.AI

RealWonder: Real-Time Physical Action-Conditioned Video Generation

Il paper presenta RealWonder, il primo sistema in tempo reale che genera video condizionati da azioni fisiche partendo da una singola immagine, integrando ricostruzione 3D, simulazione fisica e un generatore video distillato per simulare interattivamente forze, manipolazioni robotiche e comportamenti di materiali diversi.

Wei Liu, Ziyu Chen, Zizhang Li + 3 more2026-03-06🤖 cs.AI

Distributed Partial Information Puzzles: Examining Common Ground Construction Under Epistemic Asymmetry

Questo articolo introduce il Distributed Partial Information Puzzle (DPIP), un nuovo dataset multimodale per studiare la costruzione di terreno comune in condizioni di asimmetria epistemica, e dimostra che i moderni modelli linguistici di grandi dimensioni (LLM) faticano a tracciare con precisione lo stato delle credenze e l'evoluzione del compito rispetto a un approccio basato sulla logica epistemica dinamica.

Yifan Zhu, Mariah Bradford, Kenneth Lai + 4 more2026-03-06🤖 cs.AI

Leveraging LLM Parametric Knowledge for Fact Checking without Retrieval

Il paper introduce INTRA, un metodo che verifica i fatti sfruttando le conoscenze parametriche interne dei modelli linguistici senza ricorrere alla ricerca esterna, superando i limiti delle approcci basati sul retrieval e ottenendo prestazioni all'avanguardia su diversi scenari di generalizzazione.

Artem Vazhentsev, Maria Marina, Daniil Moskovskiy + 8 more2026-03-06🤖 cs.AI

SurvHTE-Bench: A Benchmark for Heterogeneous Treatment Effect Estimation in Survival Analysis

Il paper introduce SurvHTE-Bench, il primo benchmark completo per la valutazione rigorosa e riproducibile dei metodi di stima degli effetti del trattamento eterogenei su dati di sopravvivenza censurati, basato su una suite diversificata di dataset sintetici, semi-sintetici e reali.

Shahriar Noroozizadeh, Xiaobin Shen, Jeremy C. Weiss + 1 more2026-03-06🤖 cs.AI

Towards Provably Unbiased LLM Judges via Bias-Bounded Evaluation

Il paper propone un framework algoritmico chiamato "average bias-boundedness" (A-BB) che garantisce formalmente la riduzione dell'impatto negativo derivante da bias nei giudici LLM, mantenendo al contempo un'elevata correlazione con le classifiche originali.

Benjamin Feuer, Lucas Rosenblatt, Oussama Elachqar2026-03-06🤖 cs.AI

Reasoning Theater: Disentangling Model Beliefs from Chain-of-Thought

Lo studio dimostra che l'analisi delle attivazioni può rilevare la "teatro del ragionamento" nei modelli AI, consentendo un'uscita anticipata che riduce drasticamente il consumo di token mantenendo l'accuratezza, specialmente per domande di facile recall.

Siddharth Boppana, Annabel Ma, Max Loeffler + 5 more2026-03-06🤖 cs.AI

Censored LLMs as a Natural Testbed for Secret Knowledge Elicitation

Questo studio utilizza modelli LLM cinesi censurati come banco di prova naturale per valutare tecniche di elicitarazione della verità e rilevamento delle menzogne, scoprendo che metodi come il prompting few-shot e il fine-tuning migliorano significativamente l'onestà, sebbene nessuna tecnica riesca a eliminare completamente le risposte false.

Helena Casademunt, Bartosz Cywiński, Khoi Tran + 3 more2026-03-06🤖 cs.AI

The Spike, the Sparse and the Sink: Anatomy of Massive Activations and Attention Sinks

Questo studio dimostra che le "massive activations" e gli "attention sinks", sebbene spesso co-occorrenti nei modelli Transformer a causa della configurazione pre-norm, svolgono funzioni distinte agendo rispettivamente come parametri impliciti globali e come modulatori locali delle dipendenze a breve raggio.

Shangwen Sun, Alfredo Canziani, Yann LeCun + 1 more2026-03-06🤖 cs.AI

POET-X: Memory-efficient LLM Training by Scaling Orthogonal Transformation

Il paper introduce POET-X, una variante scalabile ed efficiente dal punto di vista della memoria del framework POET che, riducendo i costi computazionali delle trasformazioni ortogonali, permette l'addestramento di modelli linguistici su larga scala su una singola GPU H100 dove i metodi standard fallirebbero.

Zeju Qiu, Lixin Liu, Adrian Weller + 2 more2026-03-06🤖 cs.AI

RoboPocket: Improve Robot Policies Instantly with Your Phone

RoboPocket è un sistema portatile basato su smartphone che utilizza la realtà aumentata per visualizzare le previsioni di un robot, permettendo agli operatori di raccogliere dati mirati e aggiornare istantaneamente le politiche di apprendimento senza bisogno di un robot fisico, raddoppiando così l'efficienza dei dati rispetto alle strategie offline.

Junjie Fang, Wendi Chen, Han Xue + 7 more2026-03-06🤖 cs.AI

Recurrent Action Transformer with Memory

Il paper presenta RATE, un nuovo modello Transformer ricorrente con memoria per l'apprendimento per rinforzo offline che supera i limiti delle architetture standard negli ambienti parzialmente osservabili migliorando significativamente le prestazioni nei compiti che richiedono memoria, pur mantenendo la competitività su benchmark standard.

Egor Cherepanov, Alexey Staroverov, Alexey K. Kovalev + 1 more2026-03-05🤖 cs.AI

Catch Me If You Can Describe Me: Open-Vocabulary Camouflaged Instance Segmentation with Diffusion

Questo articolo propone un metodo innovativo per la segmentazione istanza di oggetti mimetizzati in ambito open-vocabulary, sfruttando le capacità dei modelli di diffusione testo-immagine per apprendere rappresentazioni visivo-testuali multiscala che superano le sfide poste dal camuffamento e permettono l'identificazione di nuove classi di oggetti.

Tuan-Anh Vu, Duc Thanh Nguyen, Qing Guo + 4 more2026-03-05🤖 cs.AI

← Precedente Successivo →