cs.LG articoli | Gist.Science

SOLAR: SVD-Optimized Lifelong Attention for Recommendation

Il paper presenta SOLAR, un framework di raccomandazione che utilizza l'attenzione SVD-Optimized per ridurre la complessità computazionale preservando la distribuzione softmax, permettendo così di modellare sequenze comportamentali di scala massiccia e migliorando le visualizzazioni video del 0,68% nello scenario online di Kuaishou.

Chenghao Zhang, Chao Feng, Yuanhao Pu + 8 more2026-03-04🤖 cs.LG

EdgeFLow: Serverless Federated Learning via Sequential Model Migration in Edge Networks

Il paper presenta EdgeFLow, un innovativo framework di Federated Learning che sostituisce i server cloud con una migrazione sequenziale dei modelli tra stazioni base edge, riducendo drasticamente l'overhead di comunicazione e mantenendo prestazioni di accuratezza comparabili.

Yuchen Shi, Qijun Hou, Pingyi Fan + 1 more2026-03-04🤖 cs.LG

FlashEvaluator: Expanding Search Space with Parallel Evaluation

FlashEvaluator è un nuovo framework che supera i limiti dei metodi Generator-Evaluator tradizionali consentendo la condivisione delle informazioni tra sequenze e l'elaborazione parallela in un singolo passaggio, migliorando così sia l'accuratezza della selezione che l'efficienza computazionale, con risultati già validati in produzione su Kuaishou.

Chao Feng, Yuanhao Pu, Chenghao Zhang + 8 more2026-03-04💬 cs.CL

Wasserstein Proximal Policy Gradient

Il paper introduce il Wasserstein Proximal Policy Gradient (WPPG), un metodo per l'apprendimento per rinforzo con azioni continue e regolarizzazione dell'entropia che, sfruttando la geometria di Wasserstein e un'alternanza tra trasporto ottimo e convoluzione gaussiana, evita la valutazione della densità logaritmica della politica garantendo al contempo una convergenza lineare globale e prestazioni competitive.

Zhaoyu Zhu, Shuhan Zhang, Rui Gao + 1 more2026-03-04🤖 cs.LG

Towards Parameter-Free Temporal Difference Learning

Questo lavoro propone un algoritmo TD(0) con schedule esponenziale del passo di apprendimento che, sia nel caso di campionamento i.i.d. che in quello markoviano, garantisce convergenza ottimale senza richiedere la conoscenza di parametri specifici del problema o modifiche non standard.

Yunxiang Li, Mark Schmidt, Reza Babanezhad + 1 more2026-03-04🤖 cs.LG

How Controllable Are Large Language Models? A Unified Evaluation across Behavioral Granularities

Il paper introduce SteerEval, un benchmark gerarchico che valuta la controllabilità dei modelli linguistici su tre domini e tre livelli di granularità, rivelando come il controllo tenda a degradare a livelli più fini e fornendo un quadro interpretabile per comportamenti LLM più sicuri.

Ziwen Xu, Kewei Xu, Haoming Xu + 8 more2026-03-04💬 cs.CL

Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems

Questo articolo propone un sistema di inferenza collaborativa anti-disturbo che ottimizza congiuntamente la partizione del modello DNN e l'allocazione delle risorse per massimizzare il ricavo di ritardo e accuratezza, superando le sfide poste dai jammer malintenzionati attraverso un algoritmo di ottimizzazione alternata.

Mengru Wu, Jiawei Li, Jiaqi Wei + 3 more2026-03-04⚡ eess

Low-Degree Method Fails to Predict Robust Subspace Recovery

Questo articolo dimostra che il metodo dei polinomi di basso grado fallisce nel prevedere la trattabilità computazionale di un problema di recupero robusto del sottospazio, che è invece risolvibile in tempo polinomiale sfruttando proprietà di anti-concentrazione, sfidando così l'universalità di tale metodo come predittore delle barriere computazionali.

He Jia, Aravindan Vijayaraghavan2026-03-04📊 stat

GPUTOK: GPU Accelerated Byte Level BPE Tokenization

Il paper presenta GPUTOK, un tokenizzatore BPE a livello di byte accelerato da GPU che, mantenendo la qualità dei risultati, supera le prestazioni delle soluzioni CPU esistenti (come tiktoken e HuggingFace) fino a 7,6 volte su sequenze lunghe, rendendo più pratica l'inferenza con contesti estesi.

Venu Gopal Kadamba, Kanishkha Jaisankar2026-03-04💬 cs.CL

SUN: Shared Use of Next-token Prediction for Efficient Multi-LLM Disaggregated Serving

Il paper propone SUN, un approccio innovativo per il servizio multi-LLM disaggregato che condivide un modulo di decodifica congelato tra diversi modelli, migliorando l'utilizzo delle GPU e la velocità di elaborazione senza compromettere l'accuratezza.

Sunghyeon Woo, Ahreum Seo, Jaegwang Lee + 6 more2026-03-04🤖 cs.AI

Heterogeneous Agent Collaborative Reinforcement Learning

Il paper introduce HACRL, un nuovo paradigma di apprendimento per rinforzo collaborativo che permette ad agenti eterogenei di condividere rollouts verificati durante l'addestramento per migliorare reciprocamente le proprie prestazioni senza richiedere un coordinamento in fase di inferenza, implementato tramite l'algoritmo HACPO che supera le prestazioni dei metodi esistenti riducendo al contempo i costi computazionali.

Zhixia Zhang, Zixuan Huang, Xin Xia + 7 more2026-03-04🤖 cs.LG

Combinatorial Sparse PCA Beyond the Spiked Identity Model

Questo articolo presenta il primo metodo combinatorio per la PCA sparsa che garantisce la convergenza globale su covarianze generali, superando i limiti dei modelli a picco identità e offrendo complessità computazionale ed efficienza nei campioni competitive rispetto agli approcci basati su SDP.

Syamantak Kumar, Purnamrita Sarkar, Kevin Tian + 1 more2026-03-04📊 stat

Real-Time Generative Policy via Langevin-Guided Flow Matching for Autonomous Driving

Il paper presenta DACER-F, un algoritmo di apprendimento per rinforzo che integra il flow matching e la dinamica di Langevin per abilitare politiche generative in tempo reale per la guida autonoma, superando i limiti di latenza dei metodi precedenti pur mantenendo alte prestazioni.

Tianze Zhu, Yinuo Wang, Wenjun Zou + 6 more2026-03-04🤖 cs.LG

Detecting Structural Heart Disease from Electrocardiograms via a Generalized Additive Model of Interpretable Foundation-Model Predictors

Questo studio propone un framework interpretabile che integra predittori fondati su modelli di base ECG all'interno di un modello additivo generalizzato per rilevare le malattie strutturali cardiache dagli elettrocardiogrammi, superando le prestazioni dei modelli black-box attuali e garantendo trasparenza clinica.

Ya Zhou, Zhaohong Sun, Tianxiang Hao + 1 more2026-03-04📊 stat

Same Error, Different Function: The Optimizer as an Implicit Prior in Financial Time Series

Lo studio dimostra che, in contesti di sottodeterminazione come la previsione della volatilità finanziaria, la scelta dell'ottimizzatore agisce come un pregiudizio induttivo cruciale che, pur mantenendo invariata l'accuratezza predittiva, modella funzioni non lineari diverse con impatti materiali sui portafogli di investimento, suggerendo che la valutazione dei modelli debba superare la semplice perdita scalare per includere le implicazioni funzionali e decisionali.

Federico Vittorio Cortesi, Giuseppe Iannone, Giulia Crippa + 2 more2026-03-04💰 q-fin

Implicit Bias in Deep Linear Discriminant Analysis

Questo articolo presenta un'analisi teorica iniziale del bias implicito nel Deep LDA, dimostrando che su una rete lineare diagonale a L livelli con inizializzazione bilanciata, il flusso del gradiente trasforma gli aggiornamenti additivi in moltiplicativi, garantendo automaticamente la conservazione della quasi-norma (2/L).

Jiawen Li2026-03-04📊 stat

Uni-Skill: Building Self-Evolving Skill Repository for Generalizable Robotic Manipulation

Il paper presenta Uni-Skill, un framework unificato che supera i limiti delle librerie di abilità fisse consentendo l'evoluzione automatica delle competenze attraverso l'estrazione gerarchica da video robotici su larga scala, garantendo così una generalizzazione zero-shot e una pianificazione adattiva per la manipolazione robotica.

Senwei Xie, Yuntian Zhang, Ruiping Wang + 1 more2026-03-04🤖 cs.LG

Post Hoc Extraction of Pareto Fronts for Continuous Control

Il paper introduce MAPEX, un metodo offline di apprendimento multi-obiettivo che estrae efficientemente fronti di Pareto riutilizzando politiche specializzate pre-addestrate, riducendo i costi di campionamento fino a 100.000 volte rispetto alle tecniche esistenti.

Raghav Thakar, Gaurav Dixit, Kagan Tumer2026-03-04🤖 cs.LG

MASPOB: Bandit-Based Prompt Optimization for Multi-Agent Systems with Graph Neural Networks

Il paper introduce MASPOB, un framework innovativo basato su bandit e reti neurali grafiche che ottimizza in modo efficiente i prompt per i sistemi multi-agente, risolvendo le sfide di costo di valutazione, accoppiamento topologico e complessità combinatoria.

Zhi Hong, Qian Zhang, Jiahang Sun + 5 more2026-03-04🤖 cs.AI

Robust Heterogeneous Analog-Digital Computing for Mixture-of-Experts Models with Theoretical Generalization Guarantees

Il paper propone un framework di calcolo eterogeneo analogico-digitale che assegna gli esperti sensibili al rumore e i moduli densamente attivati alla computazione digitale, mentre il resto degli esperti viene eseguito su hardware analogico, garantendo così robustezza e accuratezza nei modelli Mixture-of-Experts senza necessità di riaddestramento.

Mohammed Nowaz Rabbani Chowdhury, Hsinyu Tsai, Geoffrey W. Burr + 3 more2026-03-04🤖 cs.AI

← Precedente Successivo →