Agentic Planning with Reasoning for Image Styling via Offline RL

Il paper presenta un framework di apprendimento per rinforzo offline che utilizza la pianificazione agenziale con ragionamento esplicito e strumenti compositivi per migliorare l'editing di immagini complesso rispetto ai metodi basati su prompt diretti, supportato da nuovi dataset sintetici e valutato su modelli Qwen3-VL.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Il paper presenta un surrogato basato su una rete neurale grafica spaziotemporale a doppio grafo che, superando i limiti delle rappresentazioni nodali per le variabili interne, predice in modo efficiente e accurato le risposte non lineari di travi in cemento armato sotto flessione a quattro punti, consentendo valutazioni parametriche a costi computazionali ridotti rispetto alle simulazioni agli elementi finiti.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

Il paper propone wDPO, un metodo di allineamento robusto per i grandi modelli linguistici che utilizza una strategia di winsorizzazione gerarchica per identificare e correggere selettivamente diversi tipi di rumore nei dati di preferenza, migliorando così la qualità e la robustezza dell'allineamento rispetto alle tecniche DPO esistenti.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Questo studio presenta un sistema automatizzato basato su sensori acustici indossabili e modelli di intelligenza artificiale per la segmentazione e classificazione dei suoni intestinali, che riduce il tempo di annotazione manuale del 70% e offre agli clinici uno strumento diagnostico oggettivo e quantitativo con un'accuratezza superiore al 96%.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Questo studio introduce i dataset ODA-Fin-SFT-318k e ODA-Fin-RL-12k, ottenuti tramite distillazione e selezione basata sulla difficoltà, per addestrare modelli linguistici finanziari che superano lo stato dell'arte grazie a una maggiore qualità dei dati e a una migliore capacità di ragionamento numerico.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Questo articolo propone un metodo avanzato di regressione rango-rango condizionata basato su modelli di trasformazione profonda (DCTM) per misurare la mobilità intergenerazionale, offrendo stime più robuste e interpretabili rispetto alle tecniche tradizionali in scenari non lineari e con variabili discrete, come dimostrato da applicazioni empiriche su reddito negli USA e mobilità educativa in India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Questo studio presenta LF2L, un framework di apprendimento federato orizzontale che fonde le funzioni di perdita per integrare in modo efficace e sicuro dati eterogenei provenienti da fonti diverse (come SEER e ospedali taiwanesi), migliorando significativamente la previsione dei secondi tumori primari nei sopravvissuti al cancro al polmone senza compromettere la privacy.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Il paper propone due nuovi metodi di apprendimento simbolico, SyNF e SyTF, che generano equazioni algebriche interpretabili per prevedere serie temporali caotiche con accuratezza competitiva rispetto ai modelli deep learning, offrendo al contempo una trasparenza scientifica fondamentale per comprendere le dinamiche sottostanti.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

Il paper presenta le Variational Flow Maps, un framework che risolve il problema della generazione condizionata in un singolo passo per i modelli di flusso, trasformando la condizione da una guida del percorso di campionamento all'apprendimento di un adattatore di rumore iniziale che garantisce la coerenza con le osservazioni e le distribuzioni dei dati.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG