cs.LG articoli | Gist.Science

A multimodal slice discovery framework for systematic failure detection and explanation in medical image classification

Questo lavoro presenta il primo quadro automatizzato di auditing multimodale per la scoperta sistematica e la spiegazione dei fallimenti nei classificatori di immagini mediche, dimostrando attraverso il dataset MIMIC-CXR-JPG che l'integrazione di informazioni multimodali migliora significativamente l'identificazione e la comprensione degli errori rispetto ai metodi unimodali tradizionali.

Yixuan Liu, Kanwal K. Bhatia, Ahmed E. Fetit2026-03-02🤖 cs.LG

MT-PingEval: Evaluating Multi-Turn Collaboration with Private Information Games

Il paper presenta MT-PingEval, un metodo scalabile per valutare le capacità di collaborazione multi-turno dei modelli linguistici attraverso giochi con informazioni private, rivelando che, nonostante un ampio margine di miglioramento, gli attuali modelli faticano a superare le prestazioni di base non interattive a causa di carenze nella pianificazione e nella coerenza del discorso rispetto agli umani.

Jacob Eisenstein, Fantine Huot, Adam Fisch + 2 more2026-03-02💬 cs.CL

Uncertainty Quantification for Multimodal Large Language Models with Incoherence-adjusted Semantic Volume

Il paper presenta UMPIRE, un framework di quantificazione dell'incertezza senza addestramento per i modelli linguistici multimodali che calcola il volume semantico incoerente delle risposte utilizzando esclusivamente le caratteristiche interne del modello, superando così i limiti delle metriche esistenti e dimostrando prestazioni superiori nella rilevazione degli errori e nella calibrazione dell'incertezza su diversi compiti e modalità.

Gregory Kang Ruey Lau, Hieu Dao, Nicole Kan Hui Lin + 1 more2026-03-02💬 cs.CL

Flow-Based Density Ratio Estimation for Intractable Distributions with Applications in Genomics

Questo lavoro propone un metodo basato sul *flow matching* condizionato per stimare efficientemente i rapporti di densità tra distribuzioni intrattabili, dimostrando la sua efficacia in applicazioni di genomica a cellula singola come la stima degli effetti terapeutici e la correzione dei batch.

Egor Antipov, Alessandro Palma, Lorenzo Consoli + 3 more2026-03-02🤖 cs.LG

The Stability of Online Algorithms in Performative Prediction

Questo lavoro dimostra che qualsiasi algoritmo senza rimpianti, quando applicato alla previsione performativa, converge incondizionatamente a un equilibrio stabile performativo, superando le limitazioni delle ricerche precedenti e spiegando come algoritmi comuni prevengano cicli di feedback incontrollati.

Gabriele Farina, Juan Carlos Perdomo2026-03-02📊 stat

SenCache: Accelerating Diffusion Model Inference via Sensitivity-Aware Caching

Il paper presenta SenCache, un metodo di caching sensibile alla sensibilità che accelera l'inferenza dei modelli di diffusione per la generazione video analizzando la sensibilità dell'output del modello alle perturbazioni, consentendo una selezione dinamica e adattiva dei passi di caching che supera i metodi basati su euristiche mantenendo una qualità visiva superiore.

Yasaman Haghighi, Alexandre Alahi2026-03-02🤖 cs.LG

An Efficient Unsupervised Federated Learning Approach for Anomaly Detection in Heterogeneous IoT Networks

Questo studio propone un approccio di apprendimento federato non supervisionato ed efficiente per il rilevamento delle anomalie nelle reti IoT eterogenee, che migliora l'accuratezza sfruttando caratteristiche condivise tra dataset complementari e integrando tecniche di intelligenza artificiale spiegabile per garantire trasparenza e privacy.

Mohsen Tajgardan, Atena Shiranzaei, Mahdi Rabbani + 2 more2026-03-02🤖 cs.LG

Comparing Classical and Quantum Variational Classifiers on the XOR Problem

Lo studio dimostra che, sebbene i classificatori quantistici variazionali con circuiti sufficientemente profondi possano raggiungere la stessa accuratezza delle reti neurali classiche sul problema XOR, non offrono vantaggi empirici in termini di robustezza, efficienza o tempo di addestramento.

Miras Seilkhan, Adilbek Taizhanov2026-03-02⚛️ quant-ph

MuViT: Multi-Resolution Vision Transformers for Learning Across Scales in Microscopy

Il paper introduce MuViT, un'architettura Transformer multi-risoluzione che fusing osservazioni a diverse scale spaziali in un sistema di coordinate condiviso per migliorare l'analisi di immagini microscopiche gigapixel.

Albert Dominguez Mantes, Gioele La Manno, Martin Weigert2026-03-02🤖 cs.LG

BLISSNet: Deep Operator Learning for Fast and Accurate Flow Reconstruction from Sparse Sensor Measurements

Il paper presenta BLISSNet, un modello di apprendimento profondo basato su un'architettura simile a DeepONet che bilancia accuratezza ed efficienza computazionale per la ricostruzione di flussi fluidi da misurazioni sparse, consentendo inferenze rapide, generalizzazione a domini arbitrari e costi ridotti rispetto ai metodi di interpolazione classici.

Maksym Veremchuk, K. Andrea Scott, Zhao Pan2026-03-02🤖 cs.LG

A Variational Estimator for $L_p$ Calibration Errors

Questo articolo presenta un nuovo stimatore variazionale per gli errori di calibrazione $L_p$ che supera le limitazioni degli approcci tradizionali, consentendo una stima accurata senza sovrastima e distinguendo tra sovra- e sotto-confidenza, con un'implementazione disponibile nel pacchetto open-source probmetrics.

Eugène Berta, Sacha Braun, David Holzmüller + 2 more2026-03-02📊 stat

Adaptive Combinatorial Experimental Design: Pareto Optimality for Decision-Making and Inference

Questo articolo introduce un quadro teorico per la progettazione sperimentale combinatoria adattiva, proponendo gli algoritmi MixCombKL e MixCombUCB che raggiungono l'ottimalità di Pareto nel bilanciare la minimizzazione del rimpianto e l'inferenza statistica, dimostrando come un feedback più ricco migliori significativamente l'accuratezza delle stime.

Hongrui Xie, Junyu Cao, Kan Xu2026-03-02🤖 cs.LG

Better Learning-Augmented Spanning Tree Algorithms via Metric Forest Completion

Questo lavoro presenta un algoritmo generalizzato per il completamento di foreste metriche che interpola tra soluzioni subquadratiche e ottimali, migliorando i fattori di approssimazione per gli alberi di copertura minima appresi da 2,62 a 2 e fornendo risultati sperimentali confermati.

Nate Veldt, Thomas Stanley, Benjamin W. Priest + 5 more2026-03-02🤖 cs.LG

Time Series Foundation Models as Strong Baselines in Transportation Forecasting: A Large-Scale Benchmark Analysis

Questo studio dimostra che il modello fondazionale per serie temporali Chronos-2, valutato in modalità zero-shot su dieci dataset reali, raggiunge prestazioni competitive o all'avanguardia nella previsione dei dati di trasporto rispetto a metodi statistici e deep learning specializzati, fornendo anche una quantificazione dell'incertezza efficace senza necessità di addestramento specifico.

Javier Pulido, Filipe Rodrigues2026-03-02🤖 cs.LG

Chunk-wise Attention Transducers for Fast and Accurate Streaming Speech-to-Text

Il documento presenta CHAT, un'estensione innovativa degli RNN-T che elabora l'audio a blocchi con meccanismi di attenzione incrociata, ottenendo significativi miglioramenti sia nell'efficienza computazionale che nell'accuratezza per compiti di trascrizione e traduzione vocale in streaming.

Hainan Xu, Vladimir Bataev, Travis M. Bartley + 1 more2026-03-02🤖 cs.LG

Histopathology Image Normalization via Latent Manifold Compaction

Questo lavoro introduce la Compattazione del Manifold Latente (LMC), un framework di apprendimento non supervisionato che armonizza le immagini di istopatologia comprimendo i manifold latenti indotti dalle macchie, permettendo così una generalizzazione superiore rispetto ai metodi esistenti nelle attività di classificazione e rilevamento tra diversi batch.

Xiaolong Zhang, Jianwei Zhang, Selim Sevim + 3 more2026-03-02🤖 cs.LG

FaultXformer: A Transformer-Encoder Based Fault Classification and Location Identification model in PMU-Integrated Active Electrical Distribution System

Il paper propone FaultXformer, un modello basato su Transformer Encoder che utilizza dati di corrente da PMU per classificare e localizzare con elevata precisione (oltre il 98%) i guasti nelle reti di distribuzione attiva integrate con risorse energetiche distribuite, superando significativamente le prestazioni di architetture tradizionali come CNN, RNN e LSTM.

Kriti Thakur, Alivelu Manga Parimi, Mayukha Pal2026-03-02⚡ eess

Active Bipartite Ranking with Smooth Posterior Distributions

Questo articolo introduce l'algoritmo "smooth-rank" per il ranking bipartito in un contesto attivo con distribuzioni condizionali continue e lisce, dimostrando la sua convergenza PAC e la superiorità rispetto agli approcci basati sulla discretizzazione uniforme.

James Cheshire, Stephan Clémençon2026-03-02📊 stat

Efficient Discovery of Approximate Causal Abstractions via Neural Mechanism Sparsification

Il paper propone un metodo efficiente per scoprire astrazioni causali approssimate da reti neurali pre-addestrate riformulando il problema come una ricerca di sparsificazione meccanicistica, che deriva criteri in forma chiusa basati sul rischio interventivo per sostituire o fondere unità senza necessità di riaddestramento o interventi di scambio esaustivi.

Amir Asiaee2026-03-02🤖 cs.AI

Who Guards the Guardians? The Challenges of Evaluating Identifiability of Learned Representations

Questo articolo dimostra che le metriche standard per valutare l'identificabilità nelle rappresentazioni apprese sono spesso fuorvianti a causa di assunzioni nascoste sui processi generativi e sulla geometria del codificatore, proponendo una nuova tassonomia e una suite di valutazione per testarne la validità.

Shruti Joshi, Théo Saulus, Wieland Brendel + 3 more2026-03-02🤖 cs.LG

← Precedente Successivo →

cs.LG