cs.AI articoli | Gist.Science

Autoregressive Visual Decoding from EEG Signals

Il lavoro presenta AVDE, un framework leggero ed efficiente basato su modelli autoregressivi che supera le limitazioni delle tecniche attuali nel decodificare immagini dai segnali EEG, ottenendo risultati superiori nella ricostruzione e nel recupero visivo con una frazione dei parametri computazionali.

Sicheng Dai, Hongwang Xiao, Shan Yu, Qiwei Ye2026-03-10🤖 cs.LG

Decomposing Physician Disagreement in HealthBench

Lo studio scompone la discrepanza tra medici nel dataset HealthBench, rivelando che la maggior parte della varianza è strutturale e irriducibile, sebbene la risoluzione delle incertezze riducibili (come la mancanza di contesto) possa comunque offrire spunti pratici per migliorare la progettazione delle valutazioni dell'IA medica.

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

Il paper introduce CeRA, un adattatore parallelo a livello di pesi che supera i limiti lineari del LoRA nelle attività di ragionamento complesso espandendo il manifold tramite gating SiLU e dropout strutturale, ottenendo così una maggiore efficienza spettrale e prevenendo il collasso del rango.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

On Sample-Efficient Generalized Planning via Learned Transition Models

Questo lavoro propone un approccio di pianificazione generalizzata basato sull'apprendimento esplicito di modelli di transizione neurali che prevedono gli stati successivi, dimostrando che tale metodo supera i pianificatori basati su Transformer nella generalizzazione fuori distribuzione e nell'efficienza dei campioni, richiedendo meno dati e modelli più piccoli.

Nitin Gupta, Vishal Pallagani, John A. Aydin, Biplav Srivastava2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Questo articolo descrive come l'uso di un modello LLM specializzato per generare milioni di etichette di rilevanza testuale abbia permesso di migliorare significativamente il ranking dell'App Store, superando la scarsità di dati etichettati manualmente e ottenendo un aumento del tasso di conversione, specialmente per le query a coda lunga.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

Attn-QAT: 4-Bit Attention With Quantization-Aware Training

Questo articolo presenta Attn-QAT, il primo studio sistematico sulla quantizzazione consapevole dell'addestramento per l'attenzione a 4 bit, che risolve l'instabilità di addestramento e abilita l'inferenza FP4 ad alte prestazioni su GPU emergenti senza ricorrere a euristiche di mitigazione degli outlier.

Peiyuan Zhang, Matthew Noto, Wenxuan Tan, Chengquan Jiang, Will Lin, Wei Zhou, Hao Zhang2026-03-10🤖 cs.LG

PEPA: a Persistently Autonomous Embodied Agent with Personalities

Il paper presenta PEPA, un'architettura cognitiva a tre livelli per agenti embodied che, sfruttando tratti della personalità come principio organizzativo intrinseco, permette a un robot quadrupede di operare in modo autonomo e persistente in ambienti reali senza dipendere da obiettivi esterni predefiniti.

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

How Well Do Multimodal Models Reason on ECG Signals?

Questo lavoro introduce un framework riproducibile per valutare il ragionamento dei modelli multimodali sui segnali ECG, scomponendolo in percezione (verificata tramite codice generato da agenti) e deduzione (validata contro criteri clinici strutturati) per superare i limiti delle attuali metriche di valutazione.

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Questo studio presenta un framework di previsione conforme che garantisce coperture finite per l'estrazione di entità mediche basata su LLM, rivelando come la calibrazione dipenda dal dominio clinico e dimostrando che l'adattamento specifico del settore permette di raggiungere un'affidabilità superiore al 90% sia su documenti strutturati che su rapporti radiologici liberi.

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

Extended Empirical Validation of the Explainability Solution Space

Questo rapporto tecnico valida estensivamente lo Spazio delle Soluzioni per l'Esplicabilità (ESS) attraverso una valutazione cross-dominio che, integrando un sistema urbano intelligente oltre allo studio precedente sull'abbandono dei dipendenti, ne conferma la generalizzabilità come strumento decisionale adattivo per strategie di AI spiegabile in diversi contesti socio-tecnici.

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

Questo lavoro presenta un framework ibrido HMM-POMDP per la strategia energetica della Formula 1 del 2026, che combina un modello a stati nascosti per inferire lo stato dei rivali da dati parzialmente osservabili con una rete neurale profonda per ottimizzare le decisioni di deployment energetico e rilevare strategie ingannevoli come la "counter-harvest trap".

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

HarmonyCell è un framework di agenti end-to-end che automatizza la modellazione delle perturbazioni delle cellule singole risolvendo l'eterogeneità semantica tramite un unificatore guidato da LLM e l'eterogeneità statistica mediante una ricerca adattiva ad albero Monte Carlo, ottenendo prestazioni superiori ai metodi esistenti in scenari con spostamenti distribuzionali e semantici.

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

Il documento presenta un nuovo framework a ciclo chiuso guidato da modelli linguistici di grandi dimensioni (LLM) che migliora l'apprendimento per rinforzo profondo adattando la riutilizzabilità delle abilità e il monitoraggio dei vincoli tramite annotazioni semantiche, ottenendo così una maggiore efficienza nei dati, conformità e trasferibilità tra ambienti diversi.

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment

Questo studio presenta una pipeline basata su rilevamento e segmentazione che estrae in modo robusto e generalizzabile le onde dell'area glottale da videoendoscopia ad alta velocità, consentendo l'identificazione affidabile di biomarcatori clinici per la valutazione delle patologie laringee in tempo reale.

Harikrishnan Unnikrishnan2026-03-10🤖 cs.LG

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

Questo studio propone un framework innovativo che combina l'architettura CoAtNet con la tecnica "model soups" per classificare immagini del patrimonio culturale immateriale del Delta del Mekong, ottenendo risultati all'avanguardia su dati scarsi riducendo la varianza del modello senza aumentare i costi di inferenza.

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

Diagnosing Retrieval vs. Utilization Bottlenecks in LLM Agent Memory

Lo studio dimostra che, per gli agenti LLM potenziati da memoria, l'ottimizzazione dei metodi di recupero delle informazioni è determinante per le prestazioni finali, superando di gran lunga l'impatto delle strategie di scrittura e rivelando che lo stoccaggio grezzo spesso risulta più efficace di approcci complessi ma perdenti.

Boqin Yuan, Yue Su, Kun Yao2026-03-10🤖 cs.AI

Agentified Assessment of Logical Reasoning Agents

Il paper presenta un framework di valutazione basato su agenti per testare la capacità di ragionamento logico, dimostrando che un agente di auto-formalizzazione supera le prestazioni di un baseline chain-of-thought raggiungendo un'accuratezza dell'86,70% sul dataset FOLIO.

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

Questo articolo propone GramCol e le Mappe di Attenzione al Movimento Interpretabili (IMAP) per localizzare spazialmente e temporalmente i concetti di movimento nei Video Diffusion Transformers senza richiedere calcoli di gradiente o aggiornamenti dei parametri.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

Questo articolo dimostra teoricamente che Adam supera SGD fornendo una garanzia di convergenza ad alta probabilità con una dipendenza dal parametro di confidenza $\delta$ di ordine $\delta^{-1/2}$ , nettamente migliore rispetto alla dipendenza $\delta^{-1}$ necessaria per SGD, grazie all'analisi della normalizzazione del secondo momento.

Ruinan Jin, Yingbin Liang, Shaofeng Zou2026-03-10🤖 cs.LG

Information Routing in Atomistic Foundation Models: How Task Alignment and Equivariance Shape Linear Disentanglement

Il paper introduce la Compositional Probe Decomposition (CPD) per dimostrare che l'allineamento tra il compito di addestramento e la proprietà target, insieme all'architettura equivariante, determina il grado di disaccoppiamento lineare tra informazioni geometriche e composizionali nei modelli fondazionali atomistici, rivelando che canali vettoriali e scalari codificano selettivamente diverse proprietà fisiche.

Joshua Steier2026-03-10🤖 cs.LG

← Precedente Successivo →