VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

Il paper presenta VLN-Cache, un framework di caching dei token che supera i limiti delle metodologie esistenti nei modelli di Navigazione Visivo-Linguistica (VLN) adattandosi alle dinamiche visive e semantiche attraverso un rimappaggio allineato alla vista e un filtro di rilevanza, ottenendo un significativo aumento della velocità di inferenza senza compromettere il successo della navigazione.

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

Il paper presenta un framework di apprendimento per rinforzo offline che utilizza la pianificazione agenziale con ragionamento esplicito e strumenti compositivi per migliorare l'editing di immagini complesso rispetto ai metodi basati su prompt diretti, supportato da nuovi dataset sintetici e valutato su modelli Qwen3-VL.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Il paper presenta un surrogato basato su una rete neurale grafica spaziotemporale a doppio grafo che, superando i limiti delle rappresentazioni nodali per le variabili interne, predice in modo efficiente e accurato le risposte non lineari di travi in cemento armato sotto flessione a quattro punti, consentendo valutazioni parametriche a costi computazionali ridotti rispetto alle simulazioni agli elementi finiti.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

Il paper propone wDPO, un metodo di allineamento robusto per i grandi modelli linguistici che utilizza una strategia di winsorizzazione gerarchica per identificare e correggere selettivamente diversi tipi di rumore nei dati di preferenza, migliorando così la qualità e la robustezza dell'allineamento rispetto alle tecniche DPO esistenti.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Questo studio presenta un sistema automatizzato basato su sensori acustici indossabili e modelli di intelligenza artificiale per la segmentazione e classificazione dei suoni intestinali, che riduce il tempo di annotazione manuale del 70% e offre agli clinici uno strumento diagnostico oggettivo e quantitativo con un'accuratezza superiore al 96%.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Questo studio introduce i dataset ODA-Fin-SFT-318k e ODA-Fin-RL-12k, ottenuti tramite distillazione e selezione basata sulla difficoltà, per addestrare modelli linguistici finanziari che superano lo stato dell'arte grazie a una maggiore qualità dei dati e a una migliore capacità di ragionamento numerico.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Questo articolo propone un metodo avanzato di regressione rango-rango condizionata basato su modelli di trasformazione profonda (DCTM) per misurare la mobilità intergenerazionale, offrendo stime più robuste e interpretabili rispetto alle tecniche tradizionali in scenari non lineari e con variabili discrete, come dimostrato da applicazioni empiriche su reddito negli USA e mobilità educativa in India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Questo studio presenta LF2L, un framework di apprendimento federato orizzontale che fonde le funzioni di perdita per integrare in modo efficace e sicuro dati eterogenei provenienti da fonti diverse (come SEER e ospedali taiwanesi), migliorando significativamente la previsione dei secondi tumori primari nei sopravvissuti al cancro al polmone senza compromettere la privacy.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG