cs.AI articoli | Gist.Science

GazeMoE: Perception of Gaze Target with Mixture-of-Experts

Il paper presenta GazeMoE, un nuovo framework end-to-end che utilizza un meccanismo Mixture-of-Experts su modelli visivi pre-addestrati per stimare con stato dell'arte i target dello sguardo umano integrando segnali multi-modali e affrontando lo sbilanciamento delle classi.

Zhuangzhuang Dai, Zhongxi Lu, Vincent G. Zakka, Luis J. Manso, Jose M Alcaraz Calero, Chen Li2026-03-09🤖 cs.AI

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

Il paper propone DeCoST, un approccio basato sull'apprendimento che risolve in modo efficiente il problema di orientamento con finestre temporali e profitti variabili decouplando le variabili discrete e continue, superando gli algoritmi attuali in qualità della soluzione e velocità di inferenza.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

HiPP-Prune: Hierarchical Preference-Conditioned Structured Pruning for Vision-Language Models

Il paper presenta HiPP-Prune, un framework di pruning strutturato gerarchico condizionato dalle preferenze che ottimizza l'allocazione delle risorse nei modelli visione-linguaggio per bilanciare efficienza, utilità del compito e robustezza all'allucinazione, mitigando la degradazione della comprensione visiva attraverso segnali di sensibilità visiva e ottimizzazione multi-obiettivo.

Lincen Bai, Hedi Tabia, Raul Santos-Rodriguez2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Lo studio dimostra che l'implementazione di pipeline di ragionamento agentiche con recupero di informazioni (RAG) nel campo della radiologia riduce la dispersione decisionale tra diversi modelli linguistici e ne aumenta la robustezza collettiva, suggerendo che la valutazione di tali sistemi richieda analisi complementari alla sola accuratezza per garantire l'affidabilità clinica.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Looking Through Glass Box

Questo saggio presenta un'implementazione neurale della mappa cognitiva fuzzy (FHM) che utilizza la dinamica di Langevin per apprendere modelli causali, invertire i valori dei nodi di output e fornire criteri di modifica per l'ottimizzazione di servizi o prodotti, valutando le prestazioni su diversi dataset.

Alexis Kafantaris2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

Il paper propone Stem, un modulo di sparsità plug-and-play che ottimizza il flusso di informazioni nelle architetture causalmente vincolate attraverso una selezione top-k dipendente dalla posizione e una metrica consapevole dell'output, riducendo così la complessità computazionale e la latenza di pre-filling mantenendo un'elevata accuratezza.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Artificial Intelligence for Climate Adaptation: Reinforcement Learning for Climate Change-Resilient Transport

Questo studio propone un nuovo quadro decisionale basato sul reinforcement learning per la pianificazione dell'adattamento delle infrastrutture di trasporto ai rischi di alluvione causati dal cambiamento climatico, dimostrando attraverso un caso studio su Copenaghen che tale approccio supera i metodi tradizionali identificando percorsi di adattamento coordinati e strategie più resilienti.

Miguel Costa, Arthur Vandervoort, Carolin Schmidt, João Miranda, Morten W. Petersen, Martin Drews, Karyn Morrisey, Francisco C. Pereira2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

Il paper presenta il GMM-PIELM, un framework probabilistico che utilizza un algoritmo EM ponderato per adattare dinamicamente il campionamento dei nuclei nelle PDE rigide, consentendo alle Extreme Learning Machines di risolvere con precisione strati limite sottili e ridurre gli errori di ordini di grandezza rispetto ai metodi tradizionali, mantenendo al contempo la velocità computazionale.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

Il paper introduce EpisTwin, un'architettura neuro-simbolica che supera i limiti della frammentazione dei dati personali integrando un Grafo della Conoscenza Personale verificabile con modelli linguistici multimodali e ragionamento agente per abilitare una comprensione semantica olistica e contestuale dell'utente.

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

DEX-AR: A Dynamic Explainability Method for Autoregressive Vision-Language Models

Il paper presenta DEX-AR, un nuovo metodo di spiegabilità dinamica per modelli visione-linguaggio autoregressivi che genera mappe di calore 2D per-token e a livello di sequenza, identificando le regioni visive cruciali attraverso un meccanismo di filtraggio dinamico delle attention heads e un'aggregazione differenziata dei token, migliorando così le metriche di valutazione su diversi dataset.

Walid Bousselham, Angie Boggust, Hendrik Strobelt, Hilde Kuehne2026-03-09🤖 cs.AI

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

Il paper propone una pipeline in tre fasi per addestrare i modelli linguistici a generare stime di incertezza calibrate e interpretabili in modo efficiente, superando i limiti dei metodi post-hoc tramite il calcolo di entropia, la calibrazione di Platt e l'addestramento per rinforzo.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions

Uno studio di campo su 54 partecipanti ha rivelato che, sebbene i modelli linguistici (LLM) generino messaggi percepiti come più utili rispetto ai template, l'ottimizzazione tramite bandit non ha migliorato ulteriormente l'efficacia rispetto agli LLM puri, suggerendo che il riconoscimento contestuale delle risposte dell'utente sia il fattore determinante per l'utilità percepita nelle interventi digitali sulla salute.

Dominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. Smeddinck2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

Il paper introduce SAHOO, un framework pratico che monitora e controlla la deriva dell'allineamento durante il miglioramento ricorsivo di sé stessi attraverso tre meccanismi di salvaguardia, garantendo significativi guadagni di qualità in compiti di generazione di codice e ragionamento matematico senza compromettere vincoli di sicurezza e veridicità.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

Il paper presenta AIRT, un framework di deep learning end-to-end che genera piani di radioterapia VMAT per il cancro alla prostata in meno di un secondo, dimostrando una qualità non inferiore ai piani standard prodotti da RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

K-MaT: Knowledge-Anchored Manifold Transport for Cross-Modal Prompt Learning in Medical Imaging

Il paper presenta K-MaT, un framework di apprendimento dei prompt che utilizza il trasporto ottimo di Fused Gromov-Wasserstein per ancorare le conoscenze cliniche e trasferire le strutture decisionali dai modelli VLM biomedici ad alta risoluzione a quelli a bassa risoluzione senza necessità di immagini di addestramento, ottenendo risultati all'avanguardia in compiti di imaging medico cross-modale.

Jiajun Zeng, Shadi Albarqouni2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

Il paper presenta MoEless, il primo framework di serving serverless per modelli LLM basati su Mixture-of-Experts (MoE), che risolve il problema dello squilibrio del carico tra esperti tramite predittori leggeri e strategie di scaling ottimizzate, riducendo la latenza di inferenza del 43% e i costi dell'84% rispetto alle soluzioni esistenti.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

Il paper introduce il Dynamic Chunking Diffusion Transformer (DC-DiT), un modello che migliora l'efficienza computazionale e la qualità della generazione delle immagini adattando dinamicamente il numero di token in base alla complessità visiva e allo stadio di denoising, ottenendo risultati superiori rispetto ai DiT tradizionali con un costo di addestramento ridotto.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

Il paper presenta CLAIRE, un framework ibrido di deep learning che combina autoencoder e classificazione supervisionata per migliorare il rilevamento dei guasti nella manifattura intelligente, offrendo allo stesso tempo interpretabilità delle previsioni tramite tecniche basate sulla teoria dei giochi.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

ESAA-Security: An Event-Sourced, Verifiable Architecture for Agent-Assisted Security Audits of AI-Generated Code

Il documento presenta ESAA-Security, un'architettura di audit di sicurezza basata su eventi e verificabile che trasforma la revisione del codice generato dall'IA da una conversazione libera in un processo governato e riproducibile, separando la cognizione degli agenti dalle mutazioni di stato per garantire tracciabilità e integrità dei risultati.

Elzo Brito dos Santos Filho2026-03-09🤖 cs.AI

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Il paper estende la regolarizzazione basata sulla cinetica (KBR) per stimare con precisione le derivate spaziali da dati discreti e rumorosi, proponendo schemi espliciti e impliciti che garantiscono convergenza quadratica e permettendo la risoluzione stabile di equazioni differenziali alle derivate parziali iperboliche su nuvole di punti irregolari.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

← Precedente Successivo →