cs.AI articoli | Gist.Science

FlashPrefill: Instantaneous Pattern Discovery and Thresholding for Ultra-Fast Long-Context Prefilling

Il paper presenta FlashPrefill, un framework che abilita un prefilling ultra-rapido per modelli linguistici a lungo contesto attraverso la scoperta istantanea di pattern di attenzione e una soglia dinamica, ottenendo un speedup fino a 27,78x su sequenze di 256K senza degradare le prestazioni su contesti più brevi.

Qihang Fan, Huaibo Huang, Zhiying Wu, Juqiu Wang, Bingning Wang, Ran He2026-03-09🤖 cs.AI

Cut to the Chase: Training-free Multimodal Summarization via Chain-of-Events

Il paper introduce CoE, un framework di riepilogo multimodale senza addestramento che utilizza un Grafo Gerarchico di Eventi per guidare un ragionamento strutturato a catena, superando le limitazioni degli approcci esistenti e ottenendo prestazioni superiori su otto dataset diversi.

Xiaoxing You, Qiang Huang, Lingyu Li, Xiaojun Chang, Jun Yu2026-03-09🤖 cs.AI

Conversational Demand Response: Bidirectional Aggregator-Prosumer Coordination through Agentic AI

Questo articolo introduce la "Conversational Demand Response" (CDR), un meccanismo di coordinamento bidirezionale basato sull'intelligenza artificiale agentic che permette agli aggregatori e ai prosumer di interagire tramite linguaggio naturale, colmando il divario tra automazione scalabile e la necessità di trasparenza e controllo utente per garantire una partecipazione sostenibile.

Reda El Makroum, Sebastian Zwickl-Bernhard, Lukas Kranzl, Hans Auer2026-03-09🤖 cs.AI

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

Il paper presenta TaPD, un framework unificato e plug-and-play che utilizza la distillazione progressiva temporale-adattiva e un modulo di riempimento temporale per migliorare l'accuratezza della previsione delle traiettorie in scenari di guida autonoma con storie di osservazione variabili o estremamente brevi.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

GazeMoE: Perception of Gaze Target with Mixture-of-Experts

Il paper presenta GazeMoE, un nuovo framework end-to-end che utilizza un meccanismo Mixture-of-Experts su modelli visivi pre-addestrati per stimare con stato dell'arte i target dello sguardo umano integrando segnali multi-modali e affrontando lo sbilanciamento delle classi.

Zhuangzhuang Dai, Zhongxi Lu, Vincent G. Zakka, Luis J. Manso, Jose M Alcaraz Calero, Chen Li2026-03-09🤖 cs.AI

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

Il paper propone DeCoST, un approccio basato sull'apprendimento che risolve in modo efficiente il problema di orientamento con finestre temporali e profitti variabili decouplando le variabili discrete e continue, superando gli algoritmi attuali in qualità della soluzione e velocità di inferenza.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

HiPP-Prune: Hierarchical Preference-Conditioned Structured Pruning for Vision-Language Models

Il paper presenta HiPP-Prune, un framework di pruning strutturato gerarchico condizionato dalle preferenze che ottimizza l'allocazione delle risorse nei modelli visione-linguaggio per bilanciare efficienza, utilità del compito e robustezza all'allucinazione, mitigando la degradazione della comprensione visiva attraverso segnali di sensibilità visiva e ottimizzazione multi-obiettivo.

Lincen Bai, Hedi Tabia, Raul Santos-Rodriguez2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Lo studio dimostra che l'implementazione di pipeline di ragionamento agentiche con recupero di informazioni (RAG) nel campo della radiologia riduce la dispersione decisionale tra diversi modelli linguistici e ne aumenta la robustezza collettiva, suggerendo che la valutazione di tali sistemi richieda analisi complementari alla sola accuratezza per garantire l'affidabilità clinica.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Looking Through Glass Box

Questo saggio presenta un'implementazione neurale della mappa cognitiva fuzzy (FHM) che utilizza la dinamica di Langevin per apprendere modelli causali, invertire i valori dei nodi di output e fornire criteri di modifica per l'ottimizzazione di servizi o prodotti, valutando le prestazioni su diversi dataset.

Alexis Kafantaris2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

Il paper propone Stem, un modulo di sparsità plug-and-play che ottimizza il flusso di informazioni nelle architetture causalmente vincolate attraverso una selezione top-k dipendente dalla posizione e una metrica consapevole dell'output, riducendo così la complessità computazionale e la latenza di pre-filling mantenendo un'elevata accuratezza.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Artificial Intelligence for Climate Adaptation: Reinforcement Learning for Climate Change-Resilient Transport

Questo studio propone un nuovo quadro decisionale basato sul reinforcement learning per la pianificazione dell'adattamento delle infrastrutture di trasporto ai rischi di alluvione causati dal cambiamento climatico, dimostrando attraverso un caso studio su Copenaghen che tale approccio supera i metodi tradizionali identificando percorsi di adattamento coordinati e strategie più resilienti.

Miguel Costa, Arthur Vandervoort, Carolin Schmidt, João Miranda, Morten W. Petersen, Martin Drews, Karyn Morrisey, Francisco C. Pereira2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

Il paper presenta il GMM-PIELM, un framework probabilistico che utilizza un algoritmo EM ponderato per adattare dinamicamente il campionamento dei nuclei nelle PDE rigide, consentendo alle Extreme Learning Machines di risolvere con precisione strati limite sottili e ridurre gli errori di ordini di grandezza rispetto ai metodi tradizionali, mantenendo al contempo la velocità computazionale.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

Il paper introduce EpisTwin, un'architettura neuro-simbolica che supera i limiti della frammentazione dei dati personali integrando un Grafo della Conoscenza Personale verificabile con modelli linguistici multimodali e ragionamento agente per abilitare una comprensione semantica olistica e contestuale dell'utente.

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

DEX-AR: A Dynamic Explainability Method for Autoregressive Vision-Language Models

Il paper presenta DEX-AR, un nuovo metodo di spiegabilità dinamica per modelli visione-linguaggio autoregressivi che genera mappe di calore 2D per-token e a livello di sequenza, identificando le regioni visive cruciali attraverso un meccanismo di filtraggio dinamico delle attention heads e un'aggregazione differenziata dei token, migliorando così le metriche di valutazione su diversi dataset.

Walid Bousselham, Angie Boggust, Hendrik Strobelt, Hilde Kuehne2026-03-09🤖 cs.AI

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

Il paper propone una pipeline in tre fasi per addestrare i modelli linguistici a generare stime di incertezza calibrate e interpretabili in modo efficiente, superando i limiti dei metodi post-hoc tramite il calcolo di entropia, la calibrazione di Platt e l'addestramento per rinforzo.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions

Uno studio di campo su 54 partecipanti ha rivelato che, sebbene i modelli linguistici (LLM) generino messaggi percepiti come più utili rispetto ai template, l'ottimizzazione tramite bandit non ha migliorato ulteriormente l'efficacia rispetto agli LLM puri, suggerendo che il riconoscimento contestuale delle risposte dell'utente sia il fattore determinante per l'utilità percepita nelle interventi digitali sulla salute.

Dominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. Smeddinck2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Il paper introduce SAHOO, un framework pratico che monitora e controlla la deriva dell'allineamento durante il miglioramento ricorsivo di sé stessi attraverso tre meccanismi di salvaguardia, garantendo significativi guadagni di qualità in compiti di generazione di codice e ragionamento matematico senza compromettere vincoli di sicurezza e veridicità.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

Il paper presenta AIRT, un framework di deep learning end-to-end che genera piani di radioterapia VMAT per il cancro alla prostata in meno di un secondo, dimostrando una qualità non inferiore ai piani standard prodotti da RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

K-MaT: Knowledge-Anchored Manifold Transport for Cross-Modal Prompt Learning in Medical Imaging

Il paper presenta K-MaT, un framework di apprendimento dei prompt che utilizza il trasporto ottimo di Fused Gromov-Wasserstein per ancorare le conoscenze cliniche e trasferire le strutture decisionali dai modelli VLM biomedici ad alta risoluzione a quelli a bassa risoluzione senza necessità di immagini di addestramento, ottenendo risultati all'avanguardia in compiti di imaging medico cross-modale.

Jiajun Zeng, Shadi Albarqouni2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

Il paper presenta MoEless, il primo framework di serving serverless per modelli LLM basati su Mixture-of-Experts (MoE), che risolve il problema dello squilibrio del carico tra esperti tramite predittori leggeri e strategie di scaling ottimizzate, riducendo la latenza di inferenza del 43% e i costi dell'84% rispetto alle soluzioni esistenti.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

← Precedente Successivo →