Rich Insights from Cheap Signals: Efficient Evaluations via Tensor Factorization

Questo lavoro propone un modello statistico basato sulla fattorizzazione tensoriale che combina valutazioni automatiche a basso costo con un limitato set di dati umani per ottenere valutazioni granulari ed efficienti delle prestazioni dei modelli generativi, superando i colli di bottiglia dei dati e fornendo stime accurate delle preferenze umane senza necessità di nuove annotazioni.

Felipe Maia Polo, Aida Nematzadeh, Virginia Aglietti + 2 more2026-03-05🤖 cs.AI

Beyond Cross-Validation: Adaptive Parameter Selection for Kernel-Based Gradient Descents

Questo articolo propone una strategia adattiva per la selezione dei parametri negli algoritmi di discesa del gradiente basati su kernel, che integra l'analisi bias-varianza con il metodo di splitting e la dimensione empirica efficace, garantendo teoricamente un errore di generalizzazione ottimale e un adattamento superiore rispetto ai metodi esistenti.

Xiaotong Liu, Yunwen Lei, Xiangyu Chang + 1 more2026-03-05🤖 cs.LG

Scalable Contrastive Causal Discovery under Unknown Soft Interventions

Il paper propone un modello scalabile per la scoperta causale che, sfruttando dati osservazionali e interventivi soft con target ignoti, integra regole di orientamento contrastive per ricostruire una struttura causale globale coerente, garantendo teoricamente il recupero asintotico del PDAG identificabile e dimostrando empiricamente migliori prestazioni di generalizzazione e scalabilità.

Mingxuan Zhang, Khushi Desai, Sopho Kevlishvili + 1 more2026-03-05🤖 cs.LG

Inverse Contextual Bandits without Rewards: Learning from a Non-Stationary Learner via Suffix Imitation

Il paper propone il framework "Two-Phase Suffix Imitation" per risolvere il problema dell'Inverso Contextual Bandit senza ricompense, dimostrando che un osservatore passivo può recuperare la politica ottimale con un tasso di convergenza di O~(1/N)\tilde O(1/\sqrt{N}) ignorando i dati iniziali di esplorazione e imitando solo le azioni successive.

Yuqi Kong, Xiao Zhang, Weiran Shen2026-03-05🤖 cs.LG