Give me scissors: Collision-Free Dual-Arm Surgical Assistive Robot for Instrument Delivery

Questo articolo presenta un robot assistivo chirurgico a due bracci in grado di consegnare strumenti in modo autonomo e privo di collisioni, utilizzando modelli linguaggio-visione per interpretare i comandi e un framework di programmazione quadratica per evitare ostacoli in tempo reale, raggiungendo un tasso di successo dell'83,33% in ambienti dinamici.

Xuejin Luo, Shiquan Sun, Runshi Zhang + 2 more2026-03-04🤖 cs.LG

Wasserstein Proximal Policy Gradient

Il paper introduce il Wasserstein Proximal Policy Gradient (WPPG), un metodo per l'apprendimento per rinforzo con azioni continue e regolarizzazione dell'entropia che, sfruttando la geometria di Wasserstein e un'alternanza tra trasporto ottimo e convoluzione gaussiana, evita la valutazione della densità logaritmica della politica garantendo al contempo una convergenza lineare globale e prestazioni competitive.

Zhaoyu Zhu, Shuhan Zhang, Rui Gao + 1 more2026-03-04🤖 cs.LG

Heterogeneous Agent Collaborative Reinforcement Learning

Il paper introduce HACRL, un nuovo paradigma di apprendimento per rinforzo collaborativo che permette ad agenti eterogenei di condividere rollouts verificati durante l'addestramento per migliorare reciprocamente le proprie prestazioni senza richiedere un coordinamento in fase di inferenza, implementato tramite l'algoritmo HACPO che supera le prestazioni dei metodi esistenti riducendo al contempo i costi computazionali.

Zhixia Zhang, Zixuan Huang, Xin Xia + 7 more2026-03-04🤖 cs.LG

Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors

Questo studio propone un framework interpretabile che integra predittori fondati su modelli di base ECG all'interno di un modello additivo generalizzato per rilevare le malattie strutturali cardiache dagli elettrocardiogrammi, superando le prestazioni dei modelli black-box attuali e garantendo trasparenza clinica.

Ya Zhou, Zhaohong Sun, Tianxiang Hao + 1 more2026-03-04📊 stat

Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series

Lo studio dimostra che, in contesti di sottodeterminazione come la previsione della volatilità finanziaria, la scelta dell'ottimizzatore agisce come un pregiudizio induttivo cruciale che, pur mantenendo invariata l'accuratezza predittiva, modella funzioni non lineari diverse con impatti materiali sui portafogli di investimento, suggerendo che la valutazione dei modelli debba superare la semplice perdita scalare per includere le implicazioni funzionali e decisionali.

Federico Vittorio Cortesi, Giuseppe Iannone, Giulia Crippa + 2 more2026-03-04💰 q-fin