Frozen Policy Iteration: Computationally Efficient RL under Linear QπQ^π Realizability for Deterministic Dynamics

Il paper propone "Frozen Policy Iteration", un algoritmo di apprendimento per rinforzo online computazionalmente efficiente che, sotto l'assunzione di realizzabilità lineare delle funzioni Q per dinamiche deterministiche, raggiunge un limite di rimpianto ottimale evitando la necessità di un simulatore attraverso l'uso strategico di dati ad alta confidenza e il congelamento delle policy per gli stati già esplorati.

Yijing Ke, Zihan Zhang, Ruosong Wang2026-03-03📊 stat

MO-MIX: Multi-Objective Multi-Agent Cooperative Decision-Making With Deep Reinforcement Learning

Il paper propone MO-MIX, un metodo basato sull'apprendimento per rinforzo profondo che utilizza il framework CTDE e una rete di mixing parallela per risolvere problemi di decisione cooperativa multi-agente multi-obiettivo, generando un insieme di soluzioni Pareto ottimali con prestazioni superiori e costi computazionali ridotti rispetto ai metodi esistenti.

Tianmeng Hu, Biao Luo, Chunhua Yang + 1 more2026-03-03🤖 cs.LG

Data-driven Synthesis of Magnetic Resonance Spectroscopy Data using a Variational Autoencoder

Questo studio propone un framework basato su un autoencoder variazionale per sintetizzare dati di spettroscopia a risonanza magnetica in vivo, dimostrando che l'arricchimento dei dataset con dati sintetici migliora la qualità del segnale in applicazioni specifiche come la spettroscopia GABA-edited, pur evidenziando limitazioni nella rappresentazione del rumore stocastico e nella quantificazione assoluta dei metaboliti.

Dennis M. J. van de Sande, Julian P. Merkofer, Sina Amirrajab + 4 more2026-03-03🤖 cs.LG

SpectroFusion-ViT: A Lightweight Transformer for Speech Emotion Recognition Using Harmonic Mel-Chroma Fusion

Il paper presenta SpectroFusion-ViT, un framework leggero basato su EfficientViT-b0 che fonde le caratteristiche armoniche e Mel-Chroma per il riconoscimento delle emozioni nel parlato in lingua bengalese, ottenendo prestazioni superiori rispetto allo stato dell'arte con un'efficienza computazionale ottimizzata.

Faria Ahmed, Rafi Hassan Chowdhury, Fatema Tuz Zohora Moon + 1 more2026-03-03🤖 cs.LG

Identifying and Characterising Response in Clinical Trials: Development and Validation of a Machine Learning Approach in Colorectal Cancer

Questo studio presenta e convalida un nuovo approccio basato sull'apprendimento automatico che combina la modellazione parzialmente condizionata e il metodo Virtual Twins per identificare e caratterizzare dinamicamente la risposta ai trattamenti nei pazienti con cancro colorettale metastatico, ottenendo risultati coerenti con la letteratura e superiori ai metodi statici esistenti.

Adam Marcus, Paul Agapow2026-03-03🤖 cs.LG

Curation Leaks: Membership Inference Attacks against Data Curation for Machine Learning

Questo lavoro dimostra che i processi di curazione dei dati per il machine learning, anche quando utilizzati per selezionare dati pubblici basandosi su dati privati senza addestramento diretto, sono vulnerabili ad attacchi di inferenza dell'appartenenza che rivelano informazioni sensibili, ma che tali rischi possono essere mitigati applicando garanzie di privacy differenziale.

Dariush Wahdany, Matthew Jagielski, Adam Dziedzic + 1 more2026-03-03🤖 cs.LG