Is Exchangeability better than I.I.D to handle Data Distribution Shifts while Pooling Data for Data-scarce Medical image segmentation?

Questo lavoro affronta la scarsità di dati nella segmentazione di immagini mediche proponendo un metodo basato sull'assunzione di scambiabilità, piuttosto che sull'i.i.d., per gestire gli spostamenti distribuzionali durante il pooling di dati e migliorare le prestazioni del modello attraverso il controllo delle discrepanze tra caratteristiche di primo piano e sfondo.

Ayush Roy, Samin Enam, Jun Xia + 2 more2026-02-27🤖 cs.LG

Fast and Flexible Probabilistic Forecasting of Dynamical Systems using Flow Matching and Physical Perturbation

Il paper presenta un nuovo framework che combina l'adattamento dei flussi (flow matching) per generare perturbazioni iniziali fisicamente coerenti e l'integrazione deterministica tramite ODE per propagare efficientemente ensemble di previsioni probabilistiche su sistemi dinamici, superando i limiti computazionali e di realismo fisico dei modelli basati su diffusione.

Siddharth Rout, Eldad Haber, Stephane Gaudreault2026-02-27🤖 cs.LG

Short-Term Forecasting of Energy Production and Consumption Using Extreme Learning Machine: A Comprehensive MIMO based ELM Approach

Questo studio propone un metodo innovativo basato su una rete Extreme Learning Machine (ELM) con architettura Multi-Input Multi-Output (MIMO) e codifica temporale ciclica per la previsione a breve termine della produzione e del consumo energetico in Corsica, ottenendo prestazioni superiori rispetto ai modelli di persistenza e con minori requisiti computazionali rispetto alle reti neurali profonde.

Cyril Voyant, Milan Despotovic, Luis Garcia-Gutierrez + 5 more2026-02-27🤖 cs.LG

AquaCast: Urban Water Dynamics Forecasting with Precipitation-Informed Multi-Input Transformer

Il paper presenta AquaCast, un modello di deep learning multi-input e multi-output basato su Transformer che, integrando variabili endogene ed esogene (come le previsioni di precipitazione), supera le prestazioni degli approcci esistenti nel forecasting della dinamica delle acque urbane su dataset reali e sintetici.

Golnoosh Abdollahinejad, Saleh Baghersalimi, Denisa-Andreea Constantinescu + 2 more2026-02-27🤖 cs.LG

Statistical Advantage of Softmax Attention: Insights from Single-Location Regression

Questo studio dimostra che, in un'analisi di regressione a singola posizione ad alta dimensionalità, il meccanismo di attenzione softmax raggiunge il rischio di Bayes e supera costantemente l'attenzione lineare sia a livello di popolazione che nel regime a campioni finiti, fornendo una giustificazione teorica per il suo predominio nei modelli linguistici su larga scala.

O. Duranthon, P. Marion, C. Boyer + 2 more2026-02-27🔬 cond-mat

Compute-Optimal Quantization-Aware Training

Questo studio introduce una legge di scalabilità per la perdita che predice la ripartizione ottimale dei calcoli tra le fasi di addestramento in precisione intera e quantizzata, dimostrando che il rapporto ideale aumenta con il budget computazionale e proponendo un metodo di fusione innovativo per ridurre i costi di calcolo mantenendo alta l'accuratezza dei modelli quantizzati.

Aleksandr Dremov, David Grangier, Angelos Katharopoulos + 1 more2026-02-27🤖 cs.AI