Wasserstein Proximal Policy Gradient

Il paper introduce il Wasserstein Proximal Policy Gradient (WPPG), un metodo per l'apprendimento per rinforzo con azioni continue e regolarizzazione dell'entropia che, sfruttando la geometria di Wasserstein e un'alternanza tra trasporto ottimo e convoluzione gaussiana, evita la valutazione della densità logaritmica della politica garantendo al contempo una convergenza lineare globale e prestazioni competitive.

Zhaoyu Zhu, Shuhan Zhang, Rui Gao + 1 more2026-03-04🤖 cs.LG

Heterogeneous Agent Collaborative Reinforcement Learning

Il paper introduce HACRL, un nuovo paradigma di apprendimento per rinforzo collaborativo che permette ad agenti eterogenei di condividere rollouts verificati durante l'addestramento per migliorare reciprocamente le proprie prestazioni senza richiedere un coordinamento in fase di inferenza, implementato tramite l'algoritmo HACPO che supera le prestazioni dei metodi esistenti riducendo al contempo i costi computazionali.

Zhixia Zhang, Zixuan Huang, Xin Xia + 7 more2026-03-04🤖 cs.LG

Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors

Questo studio propone un framework interpretabile che integra predittori fondati su modelli di base ECG all'interno di un modello additivo generalizzato per rilevare le malattie strutturali cardiache dagli elettrocardiogrammi, superando le prestazioni dei modelli black-box attuali e garantendo trasparenza clinica.

Ya Zhou, Zhaohong Sun, Tianxiang Hao + 1 more2026-03-04📊 stat

Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series

Lo studio dimostra che, in contesti di sottodeterminazione come la previsione della volatilità finanziaria, la scelta dell'ottimizzatore agisce come un pregiudizio induttivo cruciale che, pur mantenendo invariata l'accuratezza predittiva, modella funzioni non lineari diverse con impatti materiali sui portafogli di investimento, suggerendo che la valutazione dei modelli debba superare la semplice perdita scalare per includere le implicazioni funzionali e decisionali.

Federico Vittorio Cortesi, Giuseppe Iannone, Giulia Crippa + 2 more2026-03-04💰 q-fin

Robust Heterogeneous Analog-Digital Computing for Mixture-of-Experts Models with Theoretical Generalization Guarantees

Il paper propone un framework di calcolo eterogeneo analogico-digitale che assegna gli esperti sensibili al rumore e i moduli densamente attivati alla computazione digitale, mentre il resto degli esperti viene eseguito su hardware analogico, garantendo così robustezza e accuratezza nei modelli Mixture-of-Experts senza necessità di riaddestramento.

Mohammed Nowaz Rabbani Chowdhury, Hsinyu Tsai, Geoffrey W. Burr + 3 more2026-03-04🤖 cs.AI