cs.LG articoli | Gist.Science

Structured Kolmogorov-Arnold Neural ODEs for Interpretable Learning and Symbolic Discovery of Nonlinear Dynamics

Il paper propone SKANODEs, un framework che integra Kolmogorov-Arnold Networks nelle Neural ODE per apprendere dinamiche non lineari interpretabili, recuperando stati fisici latenti e scoprendo automaticamente le equazioni simboliche governanti con prestazioni superiori rispetto ai metodi tradizionali.

Wei Liu, Kiran Bacsa, Loon Ching Tang + 1 more2026-03-06🔬 physics

Learning Physical Systems: Symplectification via Gauge Fixing in Dirac Structures

Questo lavoro introduce le Presymplectification Networks (PSN), un nuovo framework che risolve il problema della degenerazione della forma simplettica nei sistemi meccanici vincolati e dissipativi, come i robot quadrupedi, mappandoli su una varietà di fase aumentata tramite strutture di Dirac per garantire la conservazione dell'energia e la stabilità nelle previsioni a lungo termine.

Aristotelis Papatheodorou, Pranav Vaidhyanathan, Natalia Ares + 1 more2026-03-06💻 cs

Parameter Stress Analysis in Reinforcement Learning: Applying Synaptic Filtering to Policy Networks

Questo studio analizza la robustezza delle politiche di apprendimento per rinforzo applicando filtri sinaptici come stress interno e attacchi avversariali come stress esterno, permettendo di classificare i parametri della rete in fragili, robusti o antifragili e dimostrando come i parametri antifragili possano migliorare le prestazioni in ambienti di controllo continuo.

Zain ul Abdeen, Ming Jin2026-03-06💻 cs

MuRating: A High Quality Data Selecting Approach to Multilingual Large Language Model Pretraining

Il paper introduce MuRating, un framework scalabile che trasferisce segnali di qualità dai dati inglesi per addestrare un valutatore multilingue, permettendo la selezione di subset di dati equilibrati che migliorano significativamente le prestazioni dei modelli linguistici su compiti sia in inglese che multilingue.

Zhixun Chen, Ping Guo, Wenhan Han + 10 more2026-03-06💻 cs

Overtone: Cyclic Patch Modulation for Clean, Efficient, and Flexible Physics Emulators

Il paper presenta Overtone, un approccio innovativo che utilizza una modulazione ciclica dinamica delle dimensioni delle patch per mitigare gli errori armonici e adattare il costo computazionale nei sostituti delle equazioni differenziali parziali basati su Transformer, ottenendo prestazioni superiori rispetto ai modelli a patch fisse.

Payel Mukhopadhyay, Michael McCabe, Ruben Ohana + 1 more2026-03-06💻 cs

Some Super-approximation Rates of ReLU Neural Networks for Korobov Functions

Questo studio dimostra che le reti neurali ReLU possono approssimare le funzioni di Korobov con errori di super-approssimazione quasi ottimali negli spazi $L_p$ e $W^1_p$ , superando i limiti classici e mitigando la maledizione della dimensionalità grazie all'uso di elementi finiti su griglie sparse e tecniche di estrazione di bit.

Yuwen Li, Guozhi Zhang2026-03-06💻 cs

Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games

Questo articolo propone un metodo di apprendimento inverso per rinforzo basato sull'entropia massima e su spazi di Hilbert a kernel riproducente per giochi di campo medio, che permette di inferire funzioni di ricompensa non lineari con garanzie teoriche di convergenza e superiori prestazioni empiriche rispetto agli approcci lineari tradizionali.

Berkay Anahtarci, Can Deha Kariksiz, Naci Saldi2026-03-06🔢 math

Elucidating the Design Space of Arbitrary-Noise-Based Diffusion Models

Il paper propone EDA, un nuovo quadro teorico che unifica i modelli di diffusione basati su rumore arbitrario per migliorare le prestazioni nel ripristino delle immagini, superando i limiti dell'approccio EDM legato al rumore gaussiano fisso e dimostrando efficacia in compiti medici e naturali con un numero ridotto di passaggi di campionamento.

Xingyu Qiu, Mengying Yang, Xinghua Ma + 6 more2026-03-06💻 cs

Structured quantum learning via em algorithm for Boltzmann machines

Il paper propone un algoritmo EM quantistico per l'addestramento delle macchine di Boltzmann quantistiche, che supera il problema dei plateau sterili evitando l'ottimizzazione basata su gradienti e ottenendo risultati superiori su un'architettura ibrida semi-quantistica.

Takeshi Kimura, Kohtaro Kato, Masahito Hayashi2026-03-06⚛️ quant-ph

TIC-GRPO: Provable and Efficient Optimization for Reinforcement Learning from Human Feedback

Il paper introduce TIC-GRPO, un algoritmo di ottimizzazione per l'apprendimento da feedback umano che, sostituendo i rapporti di importanza a livello di token con un rapporto a livello di traiettoria, garantisce una stima non distorta del gradiente, una convergenza più rapida e prestazioni superiori rispetto al GRPO originale, pur mantenendo la struttura priva di critic.

Lei Pang, Jun Luo, Ruinan Jin2026-03-06💻 cs

Honest and Reliable Evaluation and Expert Equivalence Testing of Automated Neonatal Seizure Detection

Questo studio propone un quadro di valutazione onesto e affidabile per i modelli di intelligenza artificiale nella rilevazione delle convulsioni neonatali, identificando le metriche di performance ottimali e i test di equivalenza con gli esperti necessari per garantire la validità clinica.

Jovana Kljajic, John M. O'Toole, Robert Hogan + 1 more2026-03-06💻 cs

In-Training Defenses against Emergent Misalignment in Language Models

Questo studio presenta la prima analisi sistematica di misure di sicurezza durante l'addestramento per mitigare il disallineamento emergente nei modelli linguistici, dimostrando che l'intercalazione di dati selezionati in base al divario di perplessità tra modelli allineati e disallineati rappresenta la strategia più efficace per prevenire comportamenti dannosi senza compromettere le prestazioni su compiti benigni.

David Kaczér, Magnus Jørgenvåg, Clemens Vetter + 4 more2026-03-06💻 cs

Dropping Just a Handful of Preferences Can Change Top Large Language Model Rankings

Lo studio dimostra che i sistemi di classificazione dei modelli linguistici più avanzati, come Chatbot Arena, sono estremamente sensibili alla rimozione di una frazione minima di dati di preferenza, rivelando che l'ordine dei modelli leader può cambiare drasticamente con la perdita di appena lo 0,003% dei dati, mentre le valutazioni basate su esperti risultano più robuste.

Jenny Y. Huang, Yunyi Shen, Dennis Wei + 1 more2026-03-06💻 cs

How Quantization Shapes Bias in Large Language Models

Questo studio dimostra che la quantizzazione dei modelli linguistici di grandi dimensioni ha un impatto complesso sui pregiudizi, riducendo la tossicità ma tendendo ad aumentare leggermente gli stereotipi e l'ingiustizia nelle attività generative, sottolineando la necessità di bilanciare efficienza ed etica.

Federico Marcuzzi, Xuefei Ning, Roy Schwartz + 1 more2026-03-06💻 cs

Multi-Agent Reinforcement Learning in Intelligent Transportation Systems: A Comprehensive Survey

Questo articolo presenta un'indagine esaustiva sull'applicazione dell'Apprendimento per Rinforzo Multi-Agente (MARL) nei Sistemi di Trasporto Intelligenti, offrendo una tassonomia strutturata, una revisione delle applicazioni chiave e delle piattaforme di simulazione, e identificando le principali sfide per il dispiegamento nel mondo reale.

Rexcharles Donatus, Kumater Ter, Daniel Udekwe2026-03-06💻 cs

A Geometric Perspective on the Difficulties of Learning GNN-based SAT Solvers

Questo paper dimostra che la curvatura di Ricci negativa intrinseca ai grafi bipartiti derivati da formule k-SAT causa un fenomeno di "oversquashing" che limita l'efficacia dei risoluti basati su GNN, proponendo tale curvatura come indicatore geometrico chiave per prevedere la complessità del problema e l'errore di generalizzazione.

Geri Skenderi2026-03-06🔬 physics

New Insights into Optimal Alignment of Acoustic and Linguistic Representations for Knowledge Transfer in ASR

Questo lavoro propone un modello di allineamento basato sul trasporto ottimale sbilanciato, che tratta l'associazione tra rappresentazioni acustiche e linguistiche come un problema di rilevamento per gestire asimmetrie strutturali e rumore, migliorando così il trasferimento di conoscenza nei sistemi ASR.

Xugang Lu, Peng Shen, Hisashi Kawai2026-03-06💻 cs

AttnBoost: Retail Supply Chain Sales Insights via Gradient Boosting Perspective

Il paper presenta AttnBoost, un framework di apprendimento interpretabile che integra un meccanismo di attenzione a livello di funzionalità nel processo di boosting per migliorare l'accuratezza predittiva e la spiegabilità nella previsione della domanda della catena di approvvigionamento retail.

Yadi Liu, Xiaoli Ma, Muxin Ge + 6 more2026-03-06💻 cs

Topology Structure Optimization of Reservoirs Using GLMY Homology

Questo articolo propone un metodo per ottimizzare la struttura dei reservoir, basandosi sulla teoria dell'omologia GLMY persistente, dimostrando che la modifica dei cicli rappresentativi minimi dei gruppi di omologia unidimensionali migliora le prestazioni del modello in relazione alla periodicità dei dati.

Yu Chen, Shengwei Wang, Hongwei Lin2026-03-06💻 cs

TabStruct: Measuring Structural Fidelity of Tabular Data

Il paper presenta TabStruct, un nuovo framework e benchmark completo che valuta l'adeguatezza strutturale dei generatori di dati tabulari introducendo la metrica "global utility" per superare la mancanza di strutture causali reali e offrendo un'analisi su larga scala di 13 generatori su 29 dataset.

Xiangjian Jiang, Nikola Simidjievski, Mateja Jamnik2026-03-06💻 cs

← Precedente Successivo →