cs.LG articoli | Gist.Science

Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds

Questo articolo presenta il GPHDM, un nuovo approccio che genera movimenti robotici fisicamente coerenti e strutturati gerarchicamente apprendendo rappresentazioni latenti su varietà iperboliche che integrano le dinamiche temporali con le tassonomie dei movimenti.

Luis Augenstein, Noémie Jaquier, Tamim Asfour, Leonel Rozo2026-03-09🤖 cs.LG

Planner Aware Path Learning in Diffusion Language Models Training

Questo articolo introduce il Planner Aware Path Learning (PAPL), un nuovo metodo di addestramento per i modelli di linguaggio a diffusione che risolve la discrepanza tra l'inferenza pianificata e l'addestramento standard derivando un nuovo limite inferiore della verosimiglianza (P-ELBO) che allinea dinamicamente i processi di training e inferenza, ottenendo significativi miglioramenti nella generazione di proteine, testo e codice.

Fred Zhangzhi Peng, Zachary Bezemek, Jarrid Rector-Brooks, Shuibai Zhang, Anru R. Zhang, Michael Bronstein, Alexander Tong, Avishek Joey Bose2026-03-09🤖 cs.LG

Diffusion Alignment as Variational Expectation-Maximization

Il paper introduce DAV, un nuovo framework che formula l'allineamento dei modelli di diffusione come un processo iterativo di Massimizzazione Aspettazione-Variational (EM) con fasi di ricerca a tempo di test e affinamento del modello, ottimizzando le ricompense mantenendo la diversità sia per compiti continui che discreti.

Jaewoo Lee, Minsu Kim, Sanghyeok Choi, Inhyuck Song, Sujin Yun, Hyeongyu Kang, Woocheol Shin, Taeyoung Yun, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.LG

Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

Questo lavoro propone un algoritmo a due stadi basato su bandit a matrice a basso rango per minimizzare la polarizzazione e il disaccordo nel modello di dinamica delle opinioni di Friedkin-Johnsen in un contesto online dove le opinioni innate sono sconosciute e devono essere apprese attraverso osservazioni sequenziali.

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

Il paper presenta le "Self-Speculative Masked Diffusions", un nuovo modello generativo per dati discreti che riduce il carico computazionale di circa il 50% rispetto ai modelli standard, generando distribuzioni predittive non fattorizzate in un singolo passaggio tramite un meccanismo di campionamento speculativo integrato.

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

TCR-EML: Explainable Model Layers for TCR-pMHC Prediction

Il paper propone TCR-EML, un modello spiegabile per la previsione del legame TCR-pMHC che integra strati prototipici basati su meccanismi biochimici noti nei backbone dei modelli linguistici proteici, ottenendo accuratezza competitiva e spiegabilità superiore rispetto ai metodi esistenti.

Jiarui Li, Zixiang Yin, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

Questo articolo dimostra che, sebbene i modelli linguistici decoder-only siano inizialmente inferiori agli encoder-only nell'adattamento cross-modale per le equazioni differenziali parziali, l'introduzione di due nuove tecniche che mimano la bidirezionalità (Parallel Flipping e Sequence Doubling) permette di colmare il divario di prestazioni.

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

Lo studio dimostra che il micro-benchmarking dei modelli linguistici è spesso inaffidabile per il ranking di modelli con prestazioni simili, rivelando che sono necessari fino a 250 esempi per ottenere risultati consistenti e che, a quel punto, il campionamento casuale risulta competitivo rispetto ai metodi esistenti.

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

Il paper introduce CanvasMAR, un modello autoregressivo per la previsione video che migliora la qualità e la coerenza della generazione con pochi passi di campionamento, integrando un "canvas" come prior globale strutturato, un curriculum di campionamento da facile a difficile basato sul movimento e una guida classificatore composita.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Questo studio dimostra che l'iniezione di informazioni tramite un verificatore esterno di dati sintetici può prevenire il collasso del modello e migliorare le prestazioni a breve termine, guidando tuttavia i parametri verso il "centro di conoscenza" del verificatore nel lungo periodo.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

Il paper propone un nuovo metodo di raggiungibilità basato su intervalli che sfrutta la monotonia mista per fornire sovrastime efficienti e scalabili degli insiemi raggiungibili delle Neural ODE, offrendo un compromesso tra precisione e velocità ideale per applicazioni in tempo reale e ad alta dimensionalità.

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

Real-Time Learning of Predictive Dynamic Obstacle Models for Robotic Motion Planning

Questo articolo presenta un framework online che utilizza una variante della decomposizione modale dinamica di Hankel con finestre scorrevoli per denoisare e prevedere in tempo reale le dinamiche di agenti ostacolo, permettendo una pianificazione del movimento robotico più sicura e adattiva.

Stella Kombo, Masih Haseli, Skylar X. Wei, Joel W. Burdick2026-03-09🤖 cs.LG

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

Il paper introduce KLASS, un metodo di campionamento adattivo che accelera significativamente l'inferenza nei modelli di diffusione mascherata sfruttando la divergenza KL a livello di token per generare più token per iterazione senza compromettere la qualità, ottenendo risultati all'avanguardia su benchmark di ragionamento e in diversi domini.

Seo Hyun Kim, Sunwoo Hong, Hojung Jung, Youngrok Park, Se-Young Yun2026-03-09🤖 cs.LG

CADM: Cluster-customized Adaptive Distance Metric for Categorical Data Clustering

Il paper propone il CADM, un metodo innovativo per il clustering di dati categorici e misti che utilizza una metrica di distanza adattiva e personalizzata per ciascun cluster, aggiornando dinamicamente le distanze in base alle diverse distribuzioni degli attributi e ottenendo prestazioni superiori su quattordici dataset.

Taixi Chen, Yiu-ming Cheung, Yiqun Zhang2026-03-09🤖 cs.LG

FireScope: Wildfire Risk Prediction with a Chain-of-Thought Oracle

Il paper introduce FireScope, un framework basato su modelli visivo-linguistici che integra ragionamento causale e dati multimodali per generare mappe di rischio incendi ad alta risoluzione con elevata generalizzazione transcontinentale e interpretabilità.

Mario Markov (INSAIT, Sofia University "St. Kliment Ohridski"), Stefan Maria Ailuro (INSAIT, Sofia University "St. Kliment Ohridski"), Luc Van Gool (INSAIT, Sofia University "St. Kliment Ohridski"), Konrad Schindler (ETH Zurich), Danda Pani Paudel (INSAIT, Sofia University "St. Kliment Ohridski")2026-03-09🤖 cs.LG

EgoCogNav: Cognition-aware Human Egocentric Navigation

Il paper presenta EgoCogNav, un framework di navigazione egocentrica multimodale che integra fattori cognitivi e un nuovo dataset reale per prevedere l'incertezza percepita e anticipare comportamenti umani come l'esplorazione e l'esitazione in ambienti non visti.

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SPINE: Token-Selective Test-Time Reinforcement Learning with Entropy-Band Regularization

Il paper propone SPINE, un framework di apprendimento per rinforzo a test-time che seleziona e aggiorna solo i token critici ad alta entropia nelle catene di pensiero, risolvendo il collasso delle risposte tipico dei metodi precedenti e migliorando le prestazioni senza bisogno di etichette o modelli di reward.

Jianghao Wu, Yasmeen George, Jin Ye, Yicheng Wu, Daniel F. Schmidt, Jianfei Cai2026-03-09🤖 cs.LG

DAISI: Data Assimilation with Inverse Sampling using Stochastic Interpolants

Il paper introduce DAISI, un algoritmo di assimilazione dei dati scalabile basato su modelli generativi a flusso che, sfruttando un prior pre-addestrato e un'inversione di campionamento, supera le limitazioni delle approssimazioni gaussiane nei sistemi dinamici complessi e non lineari.

Martin Andrae, Erik Larsson, So Takao, Tomas Landelius, Fredrik Lindsten2026-03-09🤖 cs.LG

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

Il paper propone SQDF, un metodo di fine-tuning per modelli di diffusione che utilizza un gradiente di politica reparametrizzato basato su una stima della funzione Soft Q per allineare i modelli agli obiettivi di reward senza compromettere la diversità e la naturalità dei campioni generati.

Hyeongyu Kang, Jaewoo Lee, Woocheol Shin, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.AI

Whatever Remains Must Be True: Filtering Drives Reasoning in LLMs, Shaping Diversity

Questo lavoro propone un metodo basato sulla divergenza $\alpha$ per allineare i modelli linguistici a una distribuzione target ottenuta filtrando le risposte errate, permettendo di controllare esplicitamente il compromesso tra precisione e diversità e superando gli approcci precedenti nel benchmark di dimostrazione di teoremi Lean.

Germán Kruszewski, Pierre Erbacher, Jos Rozen, Marc Dymetman2026-03-09🤖 cs.AI

← Precedente Successivo →