cs.LG articoli | Gist.Science

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

Il paper presenta VLN-Cache, un framework di caching dei token che supera i limiti delle metodologie esistenti nei modelli di Navigazione Visivo-Linguistica (VLN) adattandosi alle dinamiche visive e semantiche attraverso un rimappaggio allineato alla vista e un filtro di rilevanza, ottenendo un significativo aumento della velocità di inferenza senza compromettere il successo della navigazione.

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Dreamer-CDP: Improving Reconstruction-free World Models Via Continuous Deterministic Representation Prediction

Il paper introduce Dreamer-CDP, un modello di mondo basato su rappresentazioni deterministiche continue che elimina la necessità di obiettivi di ricostruzione mantenendo prestazioni pari a Dreamer nell'ambiente Crafter.

Michael Hauri, Friedemann Zenke2026-03-10🤖 cs.LG

Countdown-Code: A Testbed for Studying The Emergence and Generalization of Reward Hacking in RLVR

Il paper introduce Countdown-Code, un ambiente di test che rivela come anche una minima contaminazione di dati di addestramento con strategie di "reward hacking" possa indurre modelli LLM a imparare e generalizzare tale comportamento, aggravato successivamente dall'apprendimento per rinforzo.

Muhammad Khalifa, Zohaib Khan, Omer Tafveez, Hao Peng, Lu Wang2026-03-10🤖 cs.LG

Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems

Questo articolo presenta un metodo innovativo per l'ottimizzazione di traiettorie robuste senza assunzioni distributive su sistemi stocastici non lineari e non gaussiani, utilizzando l'inferenza conforme per garantire il rispetto dei vincoli probabilistici attraverso la riformulazione in vincoli deterministici statisticamente validi.

Rihan Aaron D'Silva, Hiroyasu Tsukamoto2026-03-10🤖 cs.LG

Deep Generative Spatiotemporal Engression for Probabilistic Forecasting of Epidemics

Il paper presenta metodi di "engression" spaziotemporale profonda per generare previsioni probabilistiche affidabili sulle epidemie, quantificando l'incertezza endogenamente e superando i modelli esistenti su diversi dataset epidemiologici.

Rajdeep Pathak, Tanujit Chakraborty2026-03-10🤖 cs.LG

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

Il paper propone DualAdam, un nuovo ottimizzatore che combina i meccanismi di aggiornamento di Adam e della sua variante inversa (InvAdam) per garantire la convergenza e migliorare la generalizzazione dei modelli di deep learning, aiutandoli a evitare minimi acuti a favore di minimi piatti.

Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

Il paper presenta un framework di apprendimento per rinforzo offline che utilizza la pianificazione agenziale con ragionamento esplicito e strumenti compositivi per migliorare l'editing di immagini complesso rispetto ai metodi basati su prompt diretti, supportato da nuovi dataset sintetici e valutato su modelli Qwen3-VL.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

Spectral Conditioning of Attention Improves Transformer Performance

Il paper presenta un metodo teorico ed empirico che migliora le prestazioni dei transformer regolando le proprietà spettrali dei blocchi di attenzione per ridurre il numero di condizione del Jacobiano, offrendo una soluzione semplice e integrabile in diverse architetture.

Hemanth Saratchandran, Simon Lucey2026-03-10🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Questo articolo presenta MSKernelBench, un benchmark completo per scenari multipli, e CUDAMaster, un sistema multi-agente hardware-consapevole che ottimizza automaticamente i kernel CUDA, ottenendo accelerazioni significative che superano di circa il 35% le soluzioni esistenti e competono con librerie proprietarie come cuBLAS.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

Il paper propone SPCP, un metodo che migliora il rilevamento di dati fuori distribuzione (OOD) incoraggiando i classificatori a basarsi su pattern di contributo dei parametri più densi e orientati ai confini, riducendo così la sovrastima della confidenza tipica dei modelli profondi.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Il paper presenta un surrogato basato su una rete neurale grafica spaziotemporale a doppio grafo che, superando i limiti delle rappresentazioni nodali per le variabili interne, predice in modo efficiente e accurato le risposte non lineari di travi in cemento armato sotto flessione a quattro punti, consentendo valutazioni parametriche a costi computazionali ridotti rispetto alle simulazioni agli elementi finiti.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

Il paper propone wDPO, un metodo di allineamento robusto per i grandi modelli linguistici che utilizza una strategia di winsorizzazione gerarchica per identificare e correggere selettivamente diversi tipi di rumore nei dati di preferenza, migliorando così la qualità e la robustezza dell'allineamento rispetto alle tecniche DPO esistenti.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Questo studio presenta un sistema automatizzato basato su sensori acustici indossabili e modelli di intelligenza artificiale per la segmentazione e classificazione dei suoni intestinali, che riduce il tempo di annotazione manuale del 70% e offre agli clinici uno strumento diagnostico oggettivo e quantitativo con un'accuratezza superiore al 96%.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Margin in Abstract Spaces

Questo lavoro dimostra che l'apprendibilità basata sul margine in spazi metrici arbitrari dipende esclusivamente dalla disuguaglianza triangolare al di sopra di una soglia universale, e che tale fenomeno non è riducibile a una classificazione lineare in spazi di Banach, dove la complessità del campione scala polinomialmente con l'inverso del margine.

Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Questo studio introduce i dataset ODA-Fin-SFT-318k e ODA-Fin-RL-12k, ottenuti tramite distillazione e selezione basata sulla difficoltà, per addestrare modelli linguistici finanziari che superano lo stato dell'arte grazie a una maggiore qualità dei dati e a una migliore capacità di ragionamento numerico.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

Il paper presenta LightMedSeg, un'architettura di segmentazione medica 3D leggera e modulare che, integrando priors anatomici e meccanismi di routing adattivo, raggiunge prestazioni competitive con i modelli transformer pur richiedendo parametri e risorse computazionali drasticamente inferiori.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Questo articolo propone un metodo avanzato di regressione rango-rango condizionata basato su modelli di trasformazione profonda (DCTM) per misurare la mobilità intergenerazionale, offrendo stime più robuste e interpretabili rispetto alle tecniche tradizionali in scenari non lineari e con variabili discrete, come dimostrato da applicazioni empiriche su reddito negli USA e mobilità educativa in India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

Il paper presenta PT-RAG, un nuovo framework di generazione aumentata dal recupero che utilizza un processo di recupero differenziabile e consapevole del tipo cellulare per superare i limiti di generalizzazione dei modelli esistenti nella previsione delle risposte cellulari alle perturbazioni genetiche.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

Il paper propone WeDas, un framework che migliora gli agenti di ricerca profonda adattando le query alle strutture di indicizzazione del web attraverso un meccanismo di sonda few-shot per allineare l'intento dell'agente ai risultati di recupero.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Questo studio presenta LF2L, un framework di apprendimento federato orizzontale che fonde le funzioni di perdita per integrare in modo efficace e sicuro dati eterogenei provenienti da fonti diverse (come SEER e ospedali taiwanesi), migliorando significativamente la previsione dei secondi tumori primari nei sopravvissuti al cancro al polmone senza compromettere la privacy.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

← Precedente Successivo →