cs.LG articoli | Gist.Science

Estimating condition number with Graph Neural Networks

Questo articolo propone un metodo rapido basato sulle reti neurali su grafi per stimare il numero di condizione di matrici sparse, ottenendo un significativo accelerazione rispetto ai metodi tradizionali di Hager-Higham e Lanczos grazie a un'ingegnerizzazione delle caratteristiche efficiente.

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

Il paper dimostra che l'addestramento supervisionato con pesi esponenziali basati sulla ricompensa (exponential reward-weighted SFT) supera i metodi RLHF nei sistemi di raccomandazione generativi offrendo una soluzione robusta, scalabile e priva di hacking delle ricompense, con garanzie teoriche e un parametro di temperatura interpretabile per bilanciare miglioramento e robustezza.

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Questo lavoro propone un nuovo framework ADMM plug-and-play che integra un denoiser AC-DC per risolvere le sfide di disallineamento geometrico e garantire la convergenza nell'utilizzo di modelli generativi basati su score per problemi inversi.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

Questo articolo propone l'utilizzo della decomposizione ai valori singolari generalizzata (GSVD) per definire un punteggio angolare interpretabile che diagnostica, su base campionale, se un'osservazione è meglio spiegata da uno dei due dataset confrontati o da entrambi, valorizzando così l'apprendimento basato sulla geometria.

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

Il paper introduce Copula-ResLogit, un innovativo framework di modellazione congiunta basato su deep learning e copule che integra architetture ResNet per rilevare e mitigare gli effetti di confondimento non osservati nell'analisi della domanda di viaggio, come dimostrato da studi su dati pedonali e scelte di mobilità.

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

Il paper propone MultiwayPAM, un nuovo metodo di clustering tensoriale che analizza i punteggi ottenuti tramite LLM-as-a-Judge per ridurre i costi computazionali e identificare i bias intrinseci degli evaluator, permettendo di scoprire la struttura di appartenenza di domande, rispondenti e valutatori attraverso l'individuazione simultanea dei membri e dei medoidi di ciascun cluster.

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

Lo studio dimostra che l'entanglement quantistico offre un vantaggio competitivo negli agenti di apprendimento per rinforzo avversari, permettendo loro di superare le controparti separabili e di eguagliare o superare le prestazioni delle reti neurali classiche nel gioco di Pong.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Il paper propone HyMEM, una memoria strutturata ibrida e auto-evolutiva basata su grafi che combina nodi simbolici discreti e embedding continui per potenziare gli agenti GUI, permettendo a modelli open-source di dimensioni ridotte di superare le prestazioni di modelli proprietari avanzati.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

Il paper presenta GaLoRA, un framework efficiente in termini di parametri che integra le informazioni strutturali nei Large Language Models per migliorare la classificazione dei nodi nei grafi attribuiti al testo, ottenendo prestazioni all'avanguardia con solo lo 0,24% dei parametri necessari per il fine-tuning completo.

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

Questo lavoro introduce un framework di apprendimento in contesto guidato da modelli linguistici di grandi dimensioni che, senza bisogno di riaddestramento, migliora la previsione della volatilità finanziaria adattandosi dinamicamente alle diverse regimie di mercato attraverso un campionamento contestuale mirato.

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

Questo studio presenta una procedura di ricerca per identificare forme di schedule del learning rate quasi ottimali, rivelando che sebbene il warmup e il decadimento siano caratteristiche robuste, le famiglie di schedule comunemente utilizzate non sono ottimali e la forma ideale dipende fortemente da iperparametri come il weight decay.

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

Questo articolo propone un metodo di campionamento flessibile ed efficace basato sulla ricerca a fascio stocastica per ottimizzare le proprietà biologiche dei modelli linguistici mascherati, dimostrando attraverso valutazioni *in silico* e *in vitro* su anticorpi terapeutici che la scelta del metodo di campionamento è almeno tanto cruciale quanto quella del modello stesso.

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

Il paper presenta un framework di apprendimento di operatori non locali basato su kernel di integrazione guidati dai dati che, separando l'aggregazione delle informazioni non locali dalle previsioni non lineari locali, garantisce modelli interpretabili ed efficienti per la previsione delle precipitazioni del monsone sud-asiatico.

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

Il paper presenta NasoVoce, un'interfaccia montata sul ponte del naso che integra microfoni e sensori di vibrazione per catturare segnali acustici e ossei, permettendo conversazioni vocali con l'IA sempre disponibili, discrete e robuste al rumore ambientale.

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

Il paper propone FairFAL, un framework di apprendimento attivo federato adattivo che supera le sfide dello sbilanciamento globale delle classi e dell'eterogeneità dei dati non-IID selezionando dinamicamente tra modelli locali e globali e utilizzando strategie di campionamento guidate da prototipi per migliorare le prestazioni finali.

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

Questo lavoro risolve il problema di identificazione del braccio migliore in banditi lineari non stazionari stabilendo un limite inferiore dipendente dall'insieme dei bracci e proponendo l'algoritmo $\textsf{Adjacent-BAI}$ basato sul design ottimale adiacente, che raggiunge tale limite e supera le stime pessimistiche basate sul design G-ottimale.

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

Il paper presenta HEAL, un framework privo di RL che supera i limiti del "soffitto dell'insegnante" nella distillazione dei modelli di ragionamento integrando concetti pedagogici come la Zona di Sviluppo Prossimale con tre moduli chiave (GEAR, PURE e PACE) per riparare attivamente le traiettorie di ragionamento e guidare l'apprendimento progressivo dei modelli più piccoli.

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

Il paper propone i Causal Concept Graphs (CCG), una struttura a grafo aciclico diretto che mappa le dipendenze causali tra concetti nel latente di un LLM tramite autoencoder sparsi e apprendimento strutturale, dimostrando su diversi benchmark di ragionamento una fedeltà causale significativamente superiore rispetto ai metodi di tracciamento esistenti.

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

Questo paper estende le leggi di scalabilità neurale ai modelli Mixture-of-Experts, identificando una relazione a legge di potenza che determina l'allocazione ottimale delle risorse di calcolo tra i livelli di attenzione ed esperti per massimizzare le prestazioni entro un budget computazionale fisso.

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

Il lavoro propone una strategia di ponderazione adattiva basata sulla varianza per bilanciare la dinamica di addestramento dei modelli di diffusione a diversi livelli di rumore, migliorando così le prestazioni generative e la stabilità su CIFAR-10 e CIFAR-100.

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

← Precedente Successivo →