cs.LG articoli | Gist.Science

Characterizing Evolution in Expectation-Maximization Estimates for Overspecified Mixed Linear Regression

Questo articolo analizza teoricamente il comportamento dell'algoritmo Expectation-Maximization nella regressione lineare mista sovrastimata, dimostrando che la velocità di convergenza e l'accuratezza statistica dipendono criticamente dall'equilibrio iniziale dei pesi di miscela, con risultati lineari e di precisione $O((d/n)^{1/2})$ per configurazioni sbilanciate e risultati sublineari di precisione $O((d/n)^{1/4})$ per configurazioni bilanciate.

Zhankun Luo, Abolfazl Hashemi2026-03-09🤖 cs.LG

Kernel VICReg for Self-Supervised Learning in Reproducing Kernel Hilbert Space

Il paper propone Kernel VICReg, un nuovo framework di apprendimento auto-supervisionato che trasporta l'obiettivo VICReg in uno Spazio di Hilbert a Nucleo Riproducente (RKHS) per catturare dipendenze non lineari e migliorare le prestazioni su dati con strutture complesse o campioni limitati, superando i limiti dei metodi basati su spazio euclideo.

M. Hadi Sepanj, Benyamin Ghojogh, Saed Moradi, Paul Fieguth2026-03-09🤖 cs.LG

One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning

Il paper presenta ScaleZero, un modello unico basato su un'architettura Mixture-of-Experts e una strategia di scalatura dinamica dei parametri (DPS) che risolve i conflitti di gradino e ottimizza l'efficienza dei campioni nel pianificare compiti eterogenei, raggiungendo prestazioni paragonabili ad agenti specializzati con meno interazioni ambientali.

Yuan Pu, Yazhe Niu, Jia Tang, Junyu Xiong, Shuai Hu, Hongsheng Li2026-03-09🤖 cs.LG

Quantum parameter estimation with uncertainty quantification from continuous measurement data using neural network ensembles

Il documento dimostra che gli ensemble di reti neurali profonde permettono una stima accurata dei parametri quantistici con quantificazione dell'incertezza e rilevamento di derive nei dati sperimentali, offrendo tempi di inferenza significativamente più rapidi rispetto ai metodi bayesiani tradizionali.

Amanuel Anteneh2026-03-09⚛️ quant-ph

Reasoned Safety Alignment: Ensuring Jailbreak Defense via Answer-Then-Check

Il paper introduce "Answer-Then-Check", un nuovo approccio di allineamento alla sicurezza che addestra i modelli linguistici a generare una risposta interna e valutarne la sicurezza prima di rispondere all'utente, migliorando così la robustezza contro gli attacchi jailbreak e riducendo i falsi rifiuti senza compromettere le capacità di ragionamento generale.

Chentao Cao, Xiaojun Xu, Bo Han, Hang Li2026-03-09🤖 cs.AI

VEGA: Electric Vehicle Navigation Agent via Physics-Informed Neural Operator and Proximal Policy Optimization

VEGA è un sistema di navigazione per veicoli elettrici che combina un operatore neurale informato dalla fisica per la stima dei parametri del veicolo e un agente di apprendimento per rinforzo basato su PPO per pianificare percorsi e fermate di ricarica, dimostrando un'efficienza superiore e una rapida generalizzazione su reti stradali globali.

Hansol Lim, Minhyeok Im, Jonathan Boyack, Jee Won Lee, Jongseong Brad Choi2026-03-09🤖 cs.LG

Spectral/Spatial Tensor Atomic Cluster Expansion with Universal Embeddings in Cartesian Space

Il paper introduce il Tensor Atomic Cluster Expansion (TACE), un modello di apprendimento automatico equivariante che unifica la modellazione scalare e tensoriale nello spazio cartesiano mediante tensori cartesiani irriducibili, offrendo un'alternativa efficiente e priva di accoppiamenti di Clebsch-Gordan che garantisce accuratezza, stabilità ed efficienza su una vasta gamma di sistemi, dalle molecole finite ai materiali estesi, inclusi dati reattivi e multi-fiducia.

Zemin Xu, Wenbo Xie, P. Hu2026-03-09🔬 cond-mat.mtrl-sci

C^2Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning

Il paper propone C²Prompt, un metodo innovativo per l'apprendimento continuo federato che supera le limitazioni delle tecniche basate su prompt esistenti migliorando la coerenza della conoscenza a livello di classe attraverso un meccanismo di compensazione della distribuzione locale e uno schema di aggregazione consapevole delle classi, ottenendo così prestazioni all'avanguardia nel mitigare l'oblio temporale e spaziale.

Kunlun Xu, Yibo Feng, Jiangmeng Li, Yongsheng Qi, Jiahuan Zhou2026-03-09🤖 cs.LG

Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete

Il documento presenta un approccio di deep learning basato su un'architettura duale che combina un U-Net auto-regressivo e una rete neurale convoluzionale per prevedere in modo efficiente l'evoluzione temporale del danno da ritiro nel calcestruzzo e le relative proprietà meccaniche, al fine di ottimizzare la progettazione delle miscele.

Liya Gaynutdinova, Petr Havlásek, Ondřej Rokoš, Fleur Hendriks, Martin Doškář2026-03-09🤖 cs.LG

Taxonomy-aware Dynamic Motion Generation on Hyperbolic Manifolds

Questo articolo presenta il GPHDM, un nuovo approccio che genera movimenti robotici fisicamente coerenti e strutturati gerarchicamente apprendendo rappresentazioni latenti su varietà iperboliche che integrano le dinamiche temporali con le tassonomie dei movimenti.

Luis Augenstein, Noémie Jaquier, Tamim Asfour, Leonel Rozo2026-03-09🤖 cs.LG

Planner Aware Path Learning in Diffusion Language Models Training

Questo articolo introduce il Planner Aware Path Learning (PAPL), un nuovo metodo di addestramento per i modelli di linguaggio a diffusione che risolve la discrepanza tra l'inferenza pianificata e l'addestramento standard derivando un nuovo limite inferiore della verosimiglianza (P-ELBO) che allinea dinamicamente i processi di training e inferenza, ottenendo significativi miglioramenti nella generazione di proteine, testo e codice.

Fred Zhangzhi Peng, Zachary Bezemek, Jarrid Rector-Brooks, Shuibai Zhang, Anru R. Zhang, Michael Bronstein, Alexander Tong, Avishek Joey Bose2026-03-09🤖 cs.LG

Diffusion Alignment as Variational Expectation-Maximization

Il paper introduce DAV, un nuovo framework che formula l'allineamento dei modelli di diffusione come un processo iterativo di Massimizzazione Aspettazione-Variational (EM) con fasi di ricerca a tempo di test e affinamento del modello, ottimizzando le ricompense mantenendo la diversità sia per compiti continui che discreti.

Jaewoo Lee, Minsu Kim, Sanghyeok Choi, Inhyuck Song, Sujin Yun, Hyeongyu Kang, Woocheol Shin, Taeyoung Yun, Kiyoung Om, Jinkyoo Park2026-03-09🤖 cs.LG

Online Minimization of Polarization and Disagreement via Low-Rank Matrix Bandits

Questo lavoro propone un algoritmo a due stadi basato su bandit a matrice a basso rango per minimizzare la polarizzazione e il disaccordo nel modello di dinamica delle opinioni di Friedkin-Johnsen in un contesto online dove le opinioni innate sono sconosciute e devono essere apprese attraverso osservazioni sequenziali.

Federico Cinus, Yuko Kuroki, Atsushi Miyauchi, Francesco Bonchi2026-03-09🤖 cs.LG

Self-Speculative Masked Diffusions

Il paper presenta le "Self-Speculative Masked Diffusions", un nuovo modello generativo per dati discreti che riduce il carico computazionale di circa il 50% rispetto ai modelli standard, generando distribuzioni predittive non fattorizzate in un singolo passaggio tramite un meccanismo di campionamento speculativo integrato.

Andrew Campbell, Valentin De Bortoli, Jiaxin Shi, Arnaud Doucet2026-03-09🤖 cs.LG

TCR-EML: Explainable Model Layers for TCR-pMHC Prediction

Il paper propone TCR-EML, un modello spiegabile per la previsione del legame TCR-pMHC che integra strati prototipici basati su meccanismi biochimici noti nei backbone dei modelli linguistici proteici, ottenendo accuratezza competitiva e spiegabilità superiore rispetto ai metodi esistenti.

Jiarui Li, Zixiang Yin, Zhengming Ding, Samuel J. Landry, Ramgopal R. Mettu2026-03-09🤖 cs.LG

Decoding Partial Differential Equations: Cross-Modal Adaptation of Decoder-only Models to PDEs

Questo articolo dimostra che, sebbene i modelli linguistici decoder-only siano inizialmente inferiori agli encoder-only nell'adattamento cross-modale per le equazioni differenziali parziali, l'introduzione di due nuove tecniche che mimano la bidirezionalità (Parallel Flipping e Sequence Doubling) permette di colmare il divario di prestazioni.

Paloma García-de-Herreros, Philipp Slusallek, Dietrich Klakow, Vagrant Gautam2026-03-09🤖 cs.LG

How Reliable is Language Model Micro-Benchmarking?

Lo studio dimostra che il micro-benchmarking dei modelli linguistici è spesso inaffidabile per il ranking di modelli con prestazioni simili, rivelando che sono necessari fino a 250 esempi per ottenere risultati consistenti e che, a quel punto, il campionamento casuale risulta competitivo rispetto ai metodi esistenti.

Gregory Yauney, Shahzaib Saqib Warraich, Swabha Swayamdipta2026-03-09🤖 cs.LG

CanvasMAR: Improving Masked Autoregressive Video Prediction With Canvas

Il paper introduce CanvasMAR, un modello autoregressivo per la previsione video che migliora la qualità e la coerenza della generazione con pochi passi di campionamento, integrando un "canvas" come prior globale strutturato, un curriculum di campionamento da facile a difficile basato sul movimento e una guida classificatore composita.

Zian Li, Muhan Zhang2026-03-09🤖 cs.AI

Escaping Model Collapse via Synthetic Data Verification: Near-term Improvements and Long-term Convergence

Questo studio dimostra che l'iniezione di informazioni tramite un verificatore esterno di dati sintetici può prevenire il collasso del modello e migliorare le prestazioni a breve termine, guidando tuttavia i parametri verso il "centro di conoscenza" del verificatore nel lungo periodo.

Bingji Yi, Qiyuan Liu, Yuwei Cheng, Haifeng Xu2026-03-09🤖 cs.LG

Mixed Monotonicity Reachability Analysis of Neural ODE: A Trade-Off Between Tightness and Efficiency

Il paper propone un nuovo metodo di raggiungibilità basato su intervalli che sfrutta la monotonia mista per fornire sovrastime efficienti e scalabili degli insiemi raggiungibili delle Neural ODE, offrendo un compromesso tra precisione e velocità ideale per applicazioni in tempo reale e ad alta dimensionalità.

Abdelrahman Sayed Sayed, Pierre-Jean Meyer, Mohamed Ghazel2026-03-09🤖 cs.LG

← Precedente Successivo →