cs.AI articoli | Gist.Science

Electrocardiogram Classification with Transformers Using Koopman and Wavelet Features

Questo studio dimostra che l'integrazione di caratteristiche derivate dall'operatore di Koopman (tramite EDMD con dizionari a funzioni radiali ottimizzati) e trasformate wavelet in architetture Transformer migliora significativamente la classificazione multiclasse dei segnali ECG, superando sia le basi wavelet pure che i sistemi ibridi semplici.

Sucheta Ghosh, Zahra Monfared2026-03-10🤖 cs.LG

Towards plausibility in time series counterfactual explanations

Il paper presenta un nuovo metodo basato su ottimizzazione del gradiente che genera spiegazioni controfattuali plausibili per la classificazione di serie temporali, integrando l'allineamento soft-DTW con i vicini più prossimi per garantire una struttura temporale realistica e superare i limiti delle approcci esistenti.

Marcin Kostrzewa, Krzysztof Galus, Maciej Zi\k{e}ba2026-03-10🤖 cs.LG

Computational modeling of early language learning from acoustic speech and audiovisual input without linguistic priors

Questo capitolo esamina i recenti progressi nei modelli computazionali che, attraverso l'apprendimento auto-supervisionato e la fondazione visiva, spiegano come gli infanti acquisiscano il linguaggio da input acustici e audiovisivi senza ricorrere a precondizioni linguistiche, dimostrando come principi di apprendimento condivisi possano unificare diverse teorie sullo sviluppo cognitivo.

Okko Räsänen2026-03-10💬 cs.CL

M $^3$ -ACE: Rectifying Visual Perception in Multimodal Math Reasoning via Multi-Agentic Context Engineering

Il paper presenta M³-ACE, un framework di ingegneria contestuale multi-agente che risolve il problema della percezione visiva inaccurata nel ragionamento matematico multimodale, raggiungendo risultati all'avanguardia sul benchmark MathVision attraverso la decoupling tra percezione e ragionamento e la collaborazione dinamica di agenti per correggere errori visivi.

Peijin Xie, Zhen Xu, Bingquan Liu, Baoxun Wang2026-03-10💻 cs

A Hierarchical Error-Corrective Graph Framework for Autonomous Agents with LLM-Based Action Generation

Il documento propone il framework HECG, un sistema gerarchico per agenti autonomi basato su LLM che integra la strategia trasferibile multidimensionale (MDTS), la classificazione delle errori tramite matrice (EMC) e il recupero causale contestuale tramite grafi (CCGR) per migliorare la selezione delle strategie, l'analisi delle cause di fallimento e l'adattabilità in compiti complessi.

Cong Cao, Jingyao Zhang, Kun Tong2026-03-10💻 cs

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

Il paper presenta ToCoRL, un framework che sfrutta la plasticità comportamentale intrinseca dei modelli linguistici di grandi dimensioni, rivelata attraverso la generazione condizionata ai token, per internalizzare tramite apprendimento per rinforzo adattamenti comportamentali stabili che permettono un controllo preciso delle modalità di risposta (come passare dal ragionamento passo-passo alla risposta diretta) senza degradare le capacità del modello.

Liyuan Mao, Le Yu, Jing Zhou, Chujie Zheng, Bowen Yu, Chang Gao, Shixuan Liu, An Yang, Weinan Zhang, JunYang Lin2026-03-10🤖 cs.LG

A Recipe for Stable Offline Multi-agent Reinforcement Learning

Questo lavoro propone la normalizzazione del valore invariante alla scala (SVN) come tecnica semplice per stabilizzare la decomposizione non lineare dei valori nell'apprendimento per rinforzo multi-agente offline, fornendo una ricetta pratica che ne sblocca il pieno potenziale.

Dongsu Lee, Daehee Lee, Amy Zhang2026-03-10🤖 cs.LG

Aligning to Illusions: Choice Blindness in Human and AI Feedback

Il paper dimostra che il segnale di preferenza alla base del Reinforcement Learning from Human Feedback (RLHF) è vulnerabile a fenomeni di "cecità alla scelta" sia umani che artificiali, rivelando come le preferenze siano costruite dal contesto di elicita-zione piuttosto che riflettere stati interni stabili, il che compromette l'efficacia dell'addestramento dei modelli.

Wenbin Wu2026-03-10💬 cs.CL

Geometrically Constrained Outlier Synthesis

Il paper introduce GCOS, un framework di regolarizzazione che sintetizza outlier virtuali nello spazio delle caratteristiche rispettando la struttura geometrica dei dati in distribuzione e combinando un guscio ispirato alla conformità con un obiettivo di regolarizzazione contrastiva per migliorare la robustezza nella rilevazione di dati fuori distribuzione.

Daniil Karzanov, Marcin Detyniecki2026-03-10🤖 cs.LG

Human-Aware Robot Behaviour in Self-Driving Labs

Questo studio presenta un metodo di percezione basato sull'intelligenza artificiale che permette ai robot mobili nei laboratori scientifici autonomi di prevedere le intenzioni umane e interagire in modo proattivo, migliorando così l'efficienza della collaborazione uomo-robot rispetto ai sistemi tradizionali basati sulla semplice rilevazione di ostacoli.

Satheeshkumar Veeramani, Anna Kisil, Abigail Bentley, Hatem Fakhruldeen, Gabriella Pizzuto, Andrew I. Cooper2026-03-10💻 cs

SYNAPSE: Framework for Neuron Analysis and Perturbation in Sequence Encoding

Il paper introduce SYNAPSE, un framework sistematico e senza riaddestramento per analizzare e stress-testare i modelli Transformer, rivelando una struttura interna ridondante e stabile che, nonostante la sua robustezza funzionale, rimane vulnerabile a manipolazioni mirate.

Jesús Sánchez Ochoa, Enrique Tomás Martínez Beltrán, Alberto Huertas Celdrán2026-03-10🤖 cs.LG

IronEngine: Towards General AI Assistant

Il documento presenta IronEngine, una piattaforma per assistenti AI generici basata su un nucleo di orchestrazione unificato e un pipeline a tre fasi che integra modelli locali e cloud, memoria persistente e strumenti eseguibili, dimostrando prestazioni superiori nei benchmark operativi rispetto ad assistenti esistenti.

Xi Mo2026-03-10🤖 cs.LG

One Model Is Enough: Native Retrieval Embeddings from LLM Agent Hidden States

Il paper propone un metodo che equipaggia gli agenti LLM con capacità di recupero native mappando direttamente gli stati nascosti in uno spazio di embedding tramite un leggero strato di proiezione, eliminando la necessità di un modello di embedding separato e mantenendo il 97% della qualità del recupero rispetto alla pipeline standard.

Bo Jiang2026-03-10💬 cs.CL

Efficient Policy Learning with Hybrid Evaluation-Based Genetic Programming for Uncertain Agile Earth Observation Satellite Scheduling

Questo articolo propone un metodo di Programmazione Genetica Ibrida basata sulla Valutazione (HE-GP) che, integrando meccanismi di valutazione esatta e approssimata, risolve in modo efficiente il problema di schedulazione dei satelliti agile per l'osservazione terrestre in condizioni di incertezza, riducendo significativamente i costi computazionali rispetto alle tecniche esistenti mantenendo prestazioni ottimali.

Junhua Xue, Yuning Chen2026-03-10💻 cs

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Questo studio prospettico di fattibilità dimostra che un'intelligenza artificiale conversazionale basata su modelli linguistici (AMIE) può condurre in sicurezza colloqui clinici e formulare diagnosi differenziali in un contesto di cure primarie reale, ottenendo un'alta soddisfazione dei pazienti e una qualità delle diagnosi paragonabile a quella dei medici, sebbene i medici superino l'AI nella praticità e nel costo delle terapie proposte.

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman2026-03-10🤖 cs.LG

LycheeCluster: Efficient Long-Context Inference with Structure-Aware Chunking and Hierarchical KV Indexing

LycheeCluster è un metodo innovativo per la gestione efficiente della cache KV nei modelli linguistici su contesti lunghi, che combina un'analisi semantica dei blocchi e un indicizzazione gerarchica per ridurre la complessità di ricerca da lineare a logaritmica, ottenendo un'accelerazione fino a 3,6 volte rispetto agli stati dell'arte.

Dongfang Li, Zixuan Liu, Gang Lin, Baotian Hu, Min Zhang2026-03-10🤖 cs.LG

The Boiling Frog Threshold: Criticality and Blindness in World Model-Based Anomaly Detection Under Gradual Drift

Lo studio rivela che l'identificazione di un'anonima soglia critica di deriva osservazionale negli agenti RL basati su modelli del mondo è determinata da una complessa interazione tra rumore di fondo, sensibilità del rilevatore e dinamica ambientale, portando a una rapida "sveglia" solo oltre un limite specifico o a un fallimento irreversibile in ambienti fragili.

Zhe Hong2026-03-10🤖 cs.LG

R2F: Repurposing Ray Frontiers for LLM-free Object Navigation

Il paper presenta R2F, un framework privo di LLM che ripropone le frontiere dei raggi per la navigazione di oggetti open-vocabulary, trasformando le regioni frontali in ipotesi semantiche direzionali per ottenere prestazioni competitive in tempo reale senza la latenza computazionale dei modelli linguistici su larga scala.

Francesco Argenziano, John Mark Alexis Marcelo, Michele Brienza, Abdel Hakim Drid, Emanuele Musumeci, Daniele Nardi, Domenico D. Bloisi, Vincenzo Suriani2026-03-10💻 cs

X-AVDT: Audio-Visual Cross-Attention for Robust Deepfake Detection

Il paper propone X-AVDT, un rilevatore di deepfake robusto che sfrutta i segnali di allineamento audio-visivo interni ai generatori ottenuti tramite inversione DDIM, e introduce il nuovo dataset multimodale MMDF per valutare le prestazioni su diverse tecnologie di sintesi.

Youngseo Kim, Kwan Yun, Seokhyeon Hong, Sihun Cha, Colette Suhjung Koo, Junyong Noh2026-03-10🤖 cs.LG

Visual Self-Fulfilling Alignment: Shaping Safety-Oriented Personas via Threat-Related Images

Il paper propone la Visual Self-Fulfilling Alignment (VSFA), un metodo di allineamento senza etichette che utilizza immagini legate a minacce per addestrare i modelli linguistici visivi a sviluppare automaticamente una persona orientata alla sicurezza, riducendo così le risposte dannose senza compromettere le capacità generali.

Qishun Yang, Shu Yang, Lijie Hu, Di Wang2026-03-10💻 cs

← Precedente Successivo →

cs.AI