cs.LG articoli | Gist.Science

Graph-GRPO: Training Graph Flow Models with Reinforcement Learning

Il paper presenta Graph-GRPO, un framework di apprendimento per rinforzo online che addestra modelli di flusso grafico tramite una formula analitica per le probabilità di transizione e una strategia di raffinamento locale, ottenendo prestazioni all'avanguardia nella generazione di grafi e nell'ottimizzazione molecolare.

Baoheng Zhu, Deyu Bo, Delvin Ce Zhang, Xiao Wang2026-03-12🤖 cs.LG

On the Learning Dynamics of Two-layer Linear Networks with Label Noise SGD

Questo studio analizza le dinamiche di apprendimento delle reti lineari a due strati addestrate con SGD rumoroso sulle etichette, rivelando un comportamento in due fasi che spinge il modello dalla regione "lazy" a quella "ricca" e ne spiega il successo empirico nel migliorare la generalizzazione.

Tongcheng Zhang, Zhanpeng Zhou, Mingze Wang, Andi Han, Wei Huang, Taiji Suzuki, Junchi Yan2026-03-12🤖 cs.LG

Designing Service Systems from Textual Evidence

Questo articolo presenta PP-LUCB, un algoritmo che ottimizza la progettazione dei sistemi di servizio identificando la configurazione migliore con alta confidenza e riducendo i costi di audit umano, combinando valutazioni economiche ma distorte di modelli linguistici con verifiche mirate basate su prove testuali.

Ruicheng Ao, Hongyu Chen, Siyang Gao, Hanwei Li, David Simchi-Levi2026-03-12🤖 cs.LG

Effective Dataset Distillation for Spatio-Temporal Forecasting with Bi-dimensional Compression

Il paper presenta STemDist, il primo metodo di distillazione dei dati progettato specificamente per le previsioni spaziotemporali, che comprime in modo bilanciato le dimensioni spaziali e temporali a livello di cluster per ridurre drasticamente tempi e risorse di addestramento mantenendo un'elevata accuratezza predittiva.

Taehyung Kwon, Yeonje Choi, Yeongho Kim, Kijung Shin2026-03-12🤖 cs.LG

Domain-Adaptive Health Indicator Learning with Degradation-Stage Synchronized Sampling and Cross-Domain Autoencoder

Il paper propone un nuovo framework di apprendimento adattivo per gli indicatori di salute che combina un campionamento sincronizzato delle fasi di degradazione e un autoencoder a fusione incrociata con kernel grandi per superare le discrepanze distributive e catturare dipendenze temporali a lungo termine, ottenendo risultati superiori su dataset industriali reali.

Jungho Choo, Hanbyeol Park, Gawon Lee, Yunkyung Park, Hyerim Bae2026-03-12🤖 cs.LG

Adaptive Active Learning for Regression via Reinforcement Learning

Il paper propone WiGS, un metodo di apprendimento attivo per la regressione che utilizza l'apprendimento per rinforzo per adattare dinamicamente il criterio di selezione dei campioni, superando le limitazioni dei metodi statici e migliorando l'efficienza e l'accuratezza su dataset con densità irregolare.

Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormick2026-03-12📊 stat

GGMPs: Generalized Gaussian Mixture Processes

Il paper introduce i Generalized Gaussian Mixture Processes (GGMP), un metodo basato sui Gaussian Process che combina l'adattamento locale di miscele gaussiane e l'allineamento dei componenti per stimare densità condizionali multimodali ed eteroschedastiche in modo efficiente e scalabile.

Vardaan Tekriwal, Mark D. Risser, Hengrui Luo, Marcus M. Noack2026-03-12🤖 cs.LG

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

Il paper dimostra che la rimozione della componente di bias medio, che guida l'instabilità numerica nella formazione di modelli linguistici a bassa precisione, ripristina la stabilità e le prestazioni con un costo computazionale minimo rispetto ai metodi basati su SVD.

Hengjie Cao, Zhendong Huang, Mengyi Chen, Yifeng Yang, Fanqi Yu, Ruijun Huang, Fang Dong, Xin Zhang, Jixian Zhou, Anrui Chen, Mingzhi Dong, Yujiang Wang, Jinlong Hou, Qin Lv, Yuan Cheng, Tun Lu, Fan Yang, Li Shang2026-03-12🤖 cs.LG

Unlearning the Unpromptable: Prompt-free Instance Unlearning in Diffusion Models

Il paper propone un metodo di unlearning basato su surrogati per rimuovere selettivamente output indesiderati ma non descrivibili tramite prompt (come volti specifici o rappresentazioni culturalmente inaccurate) dai modelli di diffusione, preservando al contempo l'integrità del resto del modello.

Kyungryeol Lee, Kyeonghyun Lee, Seongmin Hong, Byung Hyun Lee, Se Young Chun2026-03-12🤖 cs.LG

Brenier Isotonic Regression

Il paper propone la "regressione isotonica di Brenier", un nuovo metodo di regressione multi-output che estende la regressione isotonica classica sfruttando il trasporto ottimo di Kantorovich per garantire la monotonia ciclica, dimostrando prestazioni superiori nella calibrazione delle probabilità e nei modelli lineari generalizzati.

Han Bao, Amirreza Eshraghi, Yutong Wang2026-03-12📊 stat

Spatio-Temporal Forecasting of Retaining Wall Deformation: Mitigating Error Accumulation via Multi-Resolution ConvLSTM Stacking Ensemble

Questo studio propone un framework di ensemble basato su modelli ConvLSTM multi-risoluzione che, integrando diverse scale temporali, mitiga l'accumulo di errori e migliora l'accuratezza delle previsioni a lungo termine delle deformazioni dei muri di sostegno durante lo scavo.

Jihoon Kim (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea), Heejung Youn (Department of Civil,Environmental Engineering, Hongik University, Seoul, Republic of Korea)2026-03-12🤖 cs.LG

Beam-Plasma Collective Oscillations in Intense Charged-Particle Beams: Dielectric Response Theory, Langmuir Wave Dispersion, and Unsupervised Detection via Prometheus

Questo articolo presenta un quadro teorico e computazionale che, combinando la teoria cinetica di Vlasov-Poisson con l'apprendimento automatico non supervisionato tramite il modello Prometheus, descrive le oscillazioni collettive di tipo Langmuir e le transizioni di fase nei fasci di particelle cariche ad energie intermedie, convalidando le previsioni analitiche attraverso simulazioni PIC.

Brandon Yee, Wilson Collins, Michael Iofin, Jiayi Fu2026-03-12🔬 physics

Muscle Synergy Priors Enhance Biomechanical Fidelity in Predictive Musculoskeletal Locomotion Simulation

Questo studio dimostra che l'integrazione di sinergie muscolari come vincoli fisiologici in un framework di apprendimento per rinforzo migliora la fedeltà biomeccanica e la generalizzazione delle simulazioni predittive della locomozione umana su terreni variabili, utilizzando dati sperimentali limitati.

Ilseung Park (Carnegie Mellon University), Eunsik Choi (Seoul National University), Jangwhan Ahn (UNC-Chapel Hill and NC State University), Jooeun Ahn (Seoul National University)2026-03-12🤖 cs.LG

Dual Space Preconditioning for Gradient Descent in the Overparameterized Regime

Questo lavoro dimostra che la Discesa del Gradiente Precondizionata nello Spazio Duale converge a una soluzione che interpola i dati nel regime sovraparametrizzato e, nel caso di precondizionatori isotropi, minimizza la distanza di Frobenius rispetto all'inizializzazione, condividendo così lo stesso bias implicito della discesa del gradiente standard.

Reza Ghane, Danil Akhtiamov, Babak Hassibi2026-03-12📊 stat

JEDI: Jointly Embedded Inference of Neural Dynamics

Il paper introduce JEDI, un modello gerarchico che infere le dinamiche neurali condivise tra diversi compiti apprendendo uno spazio di embedding comune sui pesi delle reti ricorrenti, permettendo così di estrarre meccanismi robusti e generalizzabili sia da dati simulati che da registrazioni reali della corteccia motoria.

Anirudh Jamkhandi, Ali Korojy, Olivier Codol, Guillaume Lajoie, Matthew G. Perich2026-03-12🧬 q-bio

A Universal Nearest-Neighbor Estimator for Intrinsic Dimensionality

Questo articolo presenta un nuovo stimatore universale della dimensionalità intrinseca basato sui rapporti delle distanze tra i vicini più prossimi, il quale garantisce la convergenza al valore reale indipendentemente dalla distribuzione dei dati e ottiene risultati all'avanguardia sia su manifolds teorici che su dataset reali.

Eng-Jon Ong, Omer Bobrowski, Gesine Reinert, Primoz Skraba2026-03-12🤖 cs.LG

VERI-DPO: Evidence-Aware Alignment for Clinical Summarization via Claim Verification and Direct Preference Optimization

Il paper presenta VERI-DPO, un metodo che allinea i modelli linguistici per la sintesi clinica verificando le affermazioni rispetto alle evidenze mediche e applicando l'ottimizzazione diretta delle preferenze, ottenendo così una riduzione significativa delle affermazioni non supportate e un miglioramento della validità dei riassunti ospedalieri.

Weixin Liu, Congning Ni, Qingyuan Song, Susannah L. Rose, Christopher Symons, Murat Kantarcioglu, Bradley A. Malin, Zhijun Yin2026-03-12💬 cs.CL

A New Tensor Network: Tubal Tensor Train and Its Applications

Il paper introduce la decomposizione "tubal tensor train" (TTT), un nuovo modello di rete tensoriale che combina l'algebra t-product con la struttura a nuclei di basso ordine del tensor train, offrendo una scalabilità lineare nello storage e dimostrando prestazioni efficaci in compiti come compressione di immagini e video, completamento tensoriale e imaging iperspettrale.

Salman Ahmadi-Asl, Valentin Leplat, Anh-Huy Phan, Andrzej Cichocki2026-03-12🔢 math

Resource-constrained Amazons chess decision framework integrating large language models and graph attention

Questo lavoro propone un framework ibrido leggero per il gioco delle Amazzoni che integra un autoencoder con attenzione su grafi e modelli linguistici di grandi dimensioni per generare dati sintetici e ottimizzare la ricerca ad albero, dimostrando come tale approccio superi sia i metodi tradizionali che il modello teacher stesso in ambienti con risorse computazionali limitate.

Tianhao Qian, Zhuoxuan Li, Jinde Cao, Xinli Shi, Hanjie Liu, Leszek Rutkowski2026-03-12🤖 cs.AI

IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs

Il paper introduce IH-Challenge, un dataset di addestramento basato sul reinforcement learning che migliora significativamente la gerarchia delle istruzioni e la robustezza contro gli attacchi nei modelli linguistici avanzati, riducendo al contempo i comportamenti insicuri senza comprometterne l'utilità.

Chuan Guo (Michael Pokorny), Juan Felipe Ceron Uribe (Michael Pokorny), Sicheng Zhu (Michael Pokorny), Christopher A. Choquette-Choo (Michael Pokorny), Steph Lin (Michael Pokorny), Nikhil Kandpal (Michael Pokorny), Milad Nasr (Michael Pokorny), Rai (Michael Pokorny), Sam Toyer, Miles Wang, Yaodong Yu, Alex Beutel, Kai Xiao2026-03-12🤖 cs.AI

← Precedente Successivo →