cs.LG articoli | Gist.Science

Learn Hard Problems During RL with Reference Guided Fine-tuning

Il paper introduce ReGFT, un metodo che utilizza soluzioni di riferimento parziali per generare traiettorie di ragionamento all'interno dello spazio del modello, superando la sparsità dei reward e migliorando significativamente le prestazioni del Reinforcement Learning nel ragionamento matematico.

Yangzhen Wu, Shanda Li, Zixin Wen + 5 more2026-03-06💻 cs

VoxKnesset: A Large-Scale Longitudinal Hebrew Speech Dataset for Aging Speaker Modeling

Il paper presenta VoxKnesset, un dataset longitudinale open-source di circa 2.300 ore di discorsi parlamentari ebraici che copre 16 anni, progettato per studiare l'invecchiamento della voce e migliorare la robustezza dei sistemi di elaborazione del parlato.

Yanir Marmor, Arad Zulti, David Krongauz + 4 more2026-03-06💻 cs

MatRIS: Toward Reliable and Efficient Pretrained Machine Learning Interatomic Potentials

Il lavoro presenta MatRIS, un potenziale interatomico basato su machine learning invariante che, grazie a un meccanismo di attenzione scalabile, raggiunge un'accuratezza paragonabile ai modelli equivarianti più avanzati a un costo computazionale significativamente inferiore.

Yuanchang Zhou, Siyu Hu, Xiangyu Zhang + 3 more2026-03-06💻 cs

Conformal Graph Prediction with Z-Gromov Wasserstein Distances

Il paper propone un framework di previsione conformale per output strutturati a grafo, che utilizza la distanza Z-Gromov-Wasserstein e una variante adattiva della regressione quantilica (SCQR) per fornire garanzie di copertura senza distribuzione, come dimostrato nei compiti di identificazione molecolare.

Gabriel Melo, Thibaut de Saivre, Anna Calissano + 1 more2026-03-06💻 cs

IoUCert: Robustness Verification for Anchor-based Object Detectors

Il paper introduce IoUCert, un nuovo framework di verifica formale che supera le difficoltà legate alle trasformazioni non lineari e alla metrica IoU per garantire la robustezza di modelli di rilevamento oggetti basati su anchor come SSD e YOLO.

Benedikt Brückner, Alejandro J. Mercado, Yanghao Zhang, Panagiotis Kouvaros, Alessio Lomuscio2026-03-06🔒 cs.CR

Incremental Graph Construction Enables Robust Spectral Clustering of Texts

Il paper propone un metodo di costruzione incrementale dei grafi k-NN che garantisce la connettività per qualsiasi valore di k, risolvendo il problema della frammentazione nei grafi standard e migliorando la robustezza del clustering spettrale su dati testuali.

Marko Pranjić, Boshko Koloski, Nada Lavrač + 2 more2026-03-06💻 cs

Inverse Reconstruction of Shock Time Series from Shock Response Spectrum Curves using Machine Learning

Questo studio propone l'uso di un autoencoder variazionale condizionale (CVAE) per ricostruire in modo efficiente e non iterativo i segnali temporali di shock a partire dai loro spettri di risposta (SRS), superando i limiti computazionali e di generalizzazione dei metodi tradizionali.

Adam Watts, Andrew Jeon, Destry Newton + 1 more2026-03-06💻 cs

AOI: Turning Failed Trajectories into Training Signals for Autonomous Cloud Diagnosis

Il paper presenta AOI, un framework multi-agente addestrabile che trasforma le traiettorie operative fallite in segnali di supervisione per migliorare la diagnosi autonoma dei cloud, superando le limitazioni dei dati proprietari e della sicurezza attraverso l'uso di ottimizzazione GRPO, un'architettura di esecuzione separata e un ciclo di evoluzione degli errori.

Pei Yang, Wanyi Chen, Asuka Yuxi Zheng + 11 more2026-03-06💻 cs

RADAR: Learning to Route with Asymmetry-aware DistAnce Representations

Il paper introduce RADAR, un framework neurale scalabile che risolve i problemi di instradamento dei veicoli asimmetrici migliorando le rappresentazioni delle distanze statiche tramite SVD e modellando le interazioni dinamiche con la normalizzazione di Sinkhorn, ottenendo così prestazioni superiori e una migliore generalizzazione rispetto ai metodi esistenti.

Hang Yi, Ziwei Huang, Yining Ma + 1 more2026-03-06💻 cs

stratum: A System Infrastructure for Massive Agent-Centric ML Workloads

Il paper presenta Stratum, un'infrastruttura di sistema unificata che supera le limitazioni dell'ecosistema ML Python per supportare la ricerca di pipeline guidata da agenti su larga scala, ottenendo un'accelerazione fino a 16,6 volte grazie alla decoupling dell'esecuzione dalla pianificazione e all'uso di un runtime ottimizzato in Rust.

Arnab Phani, Elias Strauss, Sebastian Schelter2026-03-06💻 cs

Why Are Linear RNNs More Parallelizable?

Questo lavoro stabilisce un legame fondamentale tra le classi di complessità computazionale e le architetture delle reti ricorrenti, dimostrando che le RNN lineari sono parallelizzabili come i transformer perché corrispondono a circuiti aritmetici di profondità logaritmica, mentre le RNN non lineari risolvono problemi completi per P che ne impediscono un'efficiente parallelizzazione.

William Merrill, Hongjian Jiang, Yanhong Li + 2 more2026-03-06💻 cs

DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement

Gli autori propongono un framework di traduzione neurale non accoppiato basato sul ponte di Schrödinger, potenziato da un allineamento distributivo guidato da diffusione e da un regolarizzatore per la preservazione anatomica, per migliorare la qualità delle immagini risonanza magnetica a ultra-basso campo (64 mT) rendendole comparabili a quelle a 3 T senza richiedere dati di addestramento accoppiati.

Youngmin Kim, Jaeyun Shin, Jeongchan Kim + 5 more2026-03-06💻 cs

LoRA-MME: Multi-Model Ensemble of LoRA-Tuned Encoders for Code Comment Classification

Il paper presenta LoRA-MME, un ensemble di quattro encoder transformer finetunati con LoRA per la classificazione multi-etichetta dei commenti al codice, che ha raggiunto un alto punteggio F1 ma ha evidenziato un compromesso tra accuratezza semantica ed efficienza computazionale nella competizione NLBSE'26.

Md Akib Haider, Ahsan Bulbul, Nafis Fuad Shahid + 2 more2026-03-06💻 cs

Lost in Translation: How Language Re-Aligns Vision for Cross-Species Pathology

Questo studio dimostra che l'allineamento linguistico, attraverso un nuovo metodo chiamato "Semantic Anchoring", risolve il collasso semantico nei modelli foundation per la patologia computazionale, migliorando significativamente la rilevazione del cancro sia in contesti interspecie che inter-tumorali senza necessità di riaddestramento.

Ekansh Arora2026-03-06💻 cs

One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache

Il paper presenta DynaKV, un innovativo framework di post-addestramento per la compressione del cache KV che assegna dinamicamente tassi di compressione a livello di token in base al loro significato semantico, ottenendo così una riduzione significativa della memoria e prestazioni superiori rispetto alle tecniche esistenti, specialmente se combinato con metodi di pruning come SnapKV.

Liming Lu, Kaixi Qiu, Jiayu Zhou + 6 more2026-03-06💻 cs

Decorrelating the Future: Joint Frequency Domain Learning for Spatio-temporal Forecasting

Il paper propone FreST Loss, un obiettivo di addestramento basato sulla trasformata di Fourier congiunta che supera i limiti delle funzioni di perdita tradizionali decorrelando le dipendenze spaziali e temporali nel dominio frequenziale, migliorando così le prestazioni dei modelli di previsione spaziotemporale su diversi dataset reali.

Zepu Wang, Bowen Liao, Jeff + 1 more2026-03-06💻 cs

Context-Dependent Affordance Computation in Vision-Language Models

Lo studio dimostra che i modelli visione-linguaggio calcolano le affordance in modo fortemente dipendente dal contesto, mostrando una deriva significativa sia lessicale che semantica che suggerisce la necessità di un'ontologia dinamica e adattiva per la robotica.

Murad Farzulla2026-03-06💻 cs

Machine Learning for Complex Systems Dynamics: Detecting Bifurcations in Dynamical Systems with Deep Neural Networks

Questo studio propone le Equilibrium-Informed Neural Networks (EINN), un approccio basato sul deep learning che inverte il processo tradizionale di analisi delle biforcazioni utilizzando stati di equilibrio come input per inferire i parametri del sistema, consentendo così di rilevare in modo efficiente le soglie critiche e i punti di svolta in sistemi dinamici complessi.

Swadesh Pal, Roderick Melnik2026-03-06🔢 math

FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning

Il paper propone FedEMA-Distill, un metodo di apprendimento federato robusto ed efficiente che combina una media mobile esponenziale con la distillazione della conoscenza basata sui logit aggregati per mitigare l'eterogeneità dei dati, ridurre il carico di comunicazione e resistere ad attacchi avversari senza richiedere modifiche ai client.

Hamza Reguieg, Mohamed El Kamili, Essaid Sabir2026-03-06💻 cs

When Scaling Fails: Network and Fabric Effects on Distributed GPU Training Performance

Questo studio empirico dimostra che le prestazioni dell'addestramento distribuito su GPU su larga scala sono spesso dominate da fattori di rete e di fabric, come la topologia e la congestione, che causano un ritorno decrescente e comportamenti instabili non rilevati dagli strumenti di profilazione standard, fornendo al contempo principi diagnostici pratici per mitigare questi problemi.

Dinesh Gopalan, Ratul Ali2026-03-06💻 cs

← Precedente Successivo →