Near-Constant Strong Violation and Last-Iterate Convergence for Online CMDPs via Decaying Safety Margins

Il paper propone l'algoritmo FlexDOME, il primo metodo a garantire teoricamente una violazione dei vincoli forte quasi costante, un regret sublineare e la convergenza all'ultima iterazione nell'apprendimento per rinforzo online sicuro per processi decisionali di Markov vincolati, ottenuti attraverso margini di sicurezza decrescenti e regolarizzazione in un quadro primal-dual.

Qian Zuo, Zhiyong Wang, Fengxiang He2026-03-04🤖 cs.LG

Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage

Il documento presenta Fun-DDPS, un framework generativo che combina modelli di diffusione nello spazio delle funzioni con surrogati neurali differenziabili per superare le sfide dei problemi inversi nella cattura e stoccaggio del carbonio, ottenendo risultati significativamente più precisi ed efficienti rispetto ai metodi deterministici e alle tecniche di campionamento tradizionali.

Xin Ju, Jiachen Yao, Anima Anandkumar + 2 more2026-03-04🤖 cs.LG

PSQE: A Theoretical-Practical Approach to Pseudo Seed Quality Enhancement for Unsupervised Multimodal Entity Alignment

Il paper propone PSQE, un approccio teorico-pratico che migliora l'allineamento di entità multimodale non supervisionato potenziando la qualità e l'equilibrio dei pseudo-seed tramite informazioni multimodali e ricampionamento, risolvendo così il problema della copertura sbilanciata del grafo e migliorando le prestazioni dei modelli basati su apprendimento contrastivo.

Yunpeng Hong, Chenyang Bu, Jie Zhang + 3 more2026-03-04🤖 cs.LG

A medical coding language model trained on clinical narratives from a population-wide cohort of 1.8 million patients

Questo studio presenta un modello linguistico addestrato su 5,8 milioni di cartelle cliniche di 1,8 milioni di pazienti in Danimarca orientale che, oltre a raggiungere elevate prestazioni nell'automazione della codifica ICD-10, ha rivelato un sistematico sottocodificamento delle diagnosi secondarie con implicazioni significative per la ricerca epidemiologica e la sorveglianza sanitaria.

Joakim Edin, Sedrah Butt Balaganeshan, Annike Kjølby Kristensen + 3 more2026-03-04🤖 cs.LG

BornoViT: A Novel Efficient Vision Transformer for Bengali Handwritten Basic Characters Classification

Il paper presenta BornoViT, un modello Vision Transformer leggero ed efficiente con soli 0,65 milioni di parametri, che classifica con successo i caratteri e le cifre scritti a mano in bengalese raggiungendo un'accuratezza del 95,77% sul dataset BanglaLekha e del 91,51% su un dataset autonomo, offrendo una soluzione ottimizzata per ambienti con risorse limitate.

Rafi Hassan Chowdhury, Naimul Haque, Kaniz Fatiha2026-03-04🤖 cs.LG

Grokking as a Phase Transition between Competing Basins: a Singular Learning Theory Approach

Questo studio applica la Teoria dell'Apprendimento Singolare (SLT) per interpretare il fenomeno del "grokking" come una transizione di fase tra bacini di soluzione competitivi, derivando espressioni analitiche per il coefficiente di apprendimento locale e fornendo evidenze empiriche che collegano tale coefficiente alla dinamica di generalizzazione nelle reti quadratiche.

Ben Cullen, Sergio Estan-Ruiz, Riya Danait + 1 more2026-03-04📊 stat