A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

Questo lavoro presenta il primo quadro automatizzato di auditing multimodale per la scoperta sistematica e la spiegazione dei fallimenti nei classificatori di immagini mediche, dimostrando attraverso il dataset MIMIC-CXR-JPG che l'integrazione di informazioni multimodali migliora significativamente l'identificazione e la comprensione degli errori rispetto ai metodi unimodali tradizionali.

Yixuan Liu, Kanwal K. Bhatia, Ahmed E. Fetit2026-03-02🤖 cs.LG

MT-PingEval: Evaluating Multi-Turn Collaboration with Private Information Games

Il paper presenta MT-PingEval, un metodo scalabile per valutare le capacità di collaborazione multi-turno dei modelli linguistici attraverso giochi con informazioni private, rivelando che, nonostante un ampio margine di miglioramento, gli attuali modelli faticano a superare le prestazioni di base non interattive a causa di carenze nella pianificazione e nella coerenza del discorso rispetto agli umani.

Jacob Eisenstein, Fantine Huot, Adam Fisch + 2 more2026-03-02💬 cs.CL

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

Il paper presenta UMPIRE, un framework di quantificazione dell'incertezza senza addestramento per i modelli linguistici multimodali che calcola il volume semantico incoerente delle risposte utilizzando esclusivamente le caratteristiche interne del modello, superando così i limiti delle metriche esistenti e dimostrando prestazioni superiori nella rilevazione degli errori e nella calibrazione dell'incertezza su diversi compiti e modalità.

Gregory Kang Ruey Lau, Hieu Dao, Nicole Kan Hui Lin + 1 more2026-03-02💬 cs.CL

SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching

Il paper presenta SenCache, un metodo di caching sensibile alla sensibilità che accelera l'inferenza dei modelli di diffusione per la generazione video analizzando la sensibilità dell'output del modello alle perturbazioni, consentendo una selezione dinamica e adattiva dei passi di caching che supera i metodi basati su euristiche mantenendo una qualità visiva superiore.

Yasaman Haghighi, Alexandre Alahi2026-03-02🤖 cs.LG

An Efficient Unsupervised Federated Learning Approach for Anomaly Detection in Heterogeneous IoT Networks

Questo studio propone un approccio di apprendimento federato non supervisionato ed efficiente per il rilevamento delle anomalie nelle reti IoT eterogenee, che migliora l'accuratezza sfruttando caratteristiche condivise tra dataset complementari e integrando tecniche di intelligenza artificiale spiegabile per garantire trasparenza e privacy.

Mohsen Tajgardan, Atena Shiranzaei, Mahdi Rabbani + 2 more2026-03-02🤖 cs.LG

BLISSNet: Deep Operator Learning for Fast and Accurate Flow Reconstruction from Sparse Sensor Measurements

Il paper presenta BLISSNet, un modello di apprendimento profondo basato su un'architettura simile a DeepONet che bilancia accuratezza ed efficienza computazionale per la ricostruzione di flussi fluidi da misurazioni sparse, consentendo inferenze rapide, generalizzazione a domini arbitrari e costi ridotti rispetto ai metodi di interpolazione classici.

Maksym Veremchuk, K. Andrea Scott, Zhao Pan2026-03-02🤖 cs.LG

Adaptive Combinatorial Experimental Design: Pareto Optimality for Decision-Making and Inference

Questo articolo introduce un quadro teorico per la progettazione sperimentale combinatoria adattiva, proponendo gli algoritmi MixCombKL e MixCombUCB che raggiungono l'ottimalità di Pareto nel bilanciare la minimizzazione del rimpianto e l'inferenza statistica, dimostrando come un feedback più ricco migliori significativamente l'accuratezza delle stime.

Hongrui Xie, Junyu Cao, Kan Xu2026-03-02🤖 cs.LG

Time Series Foundation Models as Strong Baselines in Transportation Forecasting: A Large-Scale Benchmark Analysis

Questo studio dimostra che il modello fondazionale per serie temporali Chronos-2, valutato in modalità zero-shot su dieci dataset reali, raggiunge prestazioni competitive o all'avanguardia nella previsione dei dati di trasporto rispetto a metodi statistici e deep learning specializzati, fornendo anche una quantificazione dell'incertezza efficace senza necessità di addestramento specifico.

Javier Pulido, Filipe Rodrigues2026-03-02🤖 cs.LG

FaultXformer: A Transformer-Encoder Based Fault Classification and Location Identification model in PMU-Integrated Active Electrical Distribution System

Il paper propone FaultXformer, un modello basato su Transformer Encoder che utilizza dati di corrente da PMU per classificare e localizzare con elevata precisione (oltre il 98%) i guasti nelle reti di distribuzione attiva integrate con risorse energetiche distribuite, superando significativamente le prestazioni di architetture tradizionali come CNN, RNN e LSTM.

Kriti Thakur, Alivelu Manga Parimi, Mayukha Pal2026-03-02⚡ eess