cs.LG articoli | Gist.Science

Why Does RLAIF Work At All?

Questo articolo propone l'ipotesi del valore latente, sostenendo che l'RLAIF funziona perché i prompt costituzionali attivano direzioni di valore umano già codificate nello spazio delle rappresentazioni del modello durante il preaddestramento, spiegando così i limiti e i meccanismi di allineamento osservati empiricamente.

Robin Young2026-03-04🤖 cs.AI

Breaking the Prototype Bias Loop: Confidence-Aware Federated Contrastive Learning for Highly Imbalanced Clients

Il paper propone CAFedCL, un nuovo framework di apprendimento contrastivo federato che rompe il ciclo di bias dei prototipi causato dallo squilibrio delle classi attraverso un'aggregazione basata sulla fiducia, l'aumento generativo e la regolarizzazione geometrica, garantendo così migliori prestazioni e equità rispetto alle soluzioni esistenti.

Tian-Shuang Wu, Shen-Huan Lyu, Ning Chen + 4 more2026-03-04🤖 cs.LG

SEHFS: Structural Entropy-Guided High-Order Correlation Learning for Multi-View Multi-Label Feature Selection

Il paper propone SEHFS, un nuovo metodo per la selezione delle caratteristiche nell'apprendimento multi-vista multi-etichetta che utilizza l'entropia strutturale per modellare correlazioni di ordine superiore e un framework ibrido teoria dell'informazione-matrici per superare i limiti degli ottimi locali e migliorare le prestazioni.

Cheng Peng, Yonghao Li, Wanfu Gao + 2 more2026-03-04🤖 cs.LG

Step-Level Sparse Autoencoder for Reasoning Process Interpretation

Questo lavoro propone un Autoencoder Sparsamente Attivato a Livello di Passo (SSAE) che, superando i limiti degli approcci basati sui token, disgiunge le informazioni incrementali dai passaggi di ragionamento dei LLM per estrarre caratteristiche interpretabili che rivelano la capacità del modello di prevedere la correttezza e la logica dei propri ragionamenti.

Xuan Yang, Jiayu Liu, Yuhang Lai + 3 more2026-03-04🤖 cs.LG

Generalized Bayes for Causal Inference

Questo articolo propone un quadro bayesiano generalizzato per l'inferenza causale che, evitando la modellazione esplicita della verosimiglianza e aggiornando direttamente le stime degli effetti causali tramite funzioni di perdita, trasforma gli stimatori esistenti in strumenti dotati di una completa quantificazione dell'incertezza, garantendo al contempo robustezza agli errori di stima delle variabili di disturbo e validità frequentista.

Emil Javurek, Dennis Frauen, Yuxin Wang + 1 more2026-03-04📊 stat

cPNN: Continuous Progressive Neural Networks for Evolving Streaming Time Series

Il paper propone cPNN, una rete neurale progressiva continua basata su RNN che risolve congiuntamente il problema della deriva concettuale e delle dipendenze temporali nei flussi di dati in evoluzione, prevenendo al contempo la dimenticanza catastrofica.

Federico Giannini, Giacomo Ziffer, Emanuele Della Valle2026-03-04🤖 cs.AI

Reinforcement Learning with Symbolic Reward Machines

Il paper propone le Symbolic Reward Machines (SRM) e i relativi algoritmi di apprendimento QSRM e LSRM per superare i limiti delle Reward Machine tradizionali, consentendo l'elaborazione diretta delle osservazioni ambientali tramite formule simboliche senza richiedere etichette manuali, mantenendo al contempo prestazioni superiori rispetto ai metodi RL di base e paragonabili a quelle delle RM esistenti.

Thomas Krug, Daniel Neider2026-03-04🤖 cs.AI

Safe and Robust Domains of Attraction for Discrete-Time Systems: A Set-Based Characterization and Certifiable Neural Network Estimation

Questo articolo propone un nuovo quadro teorico e computazionale basato su funzioni di valore definite su spazi metrici e reti neurali fisicamente informate, per la caratterizzazione precisa e la stima certificabile dei domini di attrazione sicuri e robusti per sistemi non lineari discreti incerti soggetti a vincoli di stato.

Mohamed Serry, Maxwell Fitzsimmons, Jun Liu2026-03-04⚡ eess

On the Expressive Power of Transformers for Maxout Networks and Continuous Piecewise Linear Functions

Questo articolo dimostra che le reti Transformer possiedono un potere espressivo universale paragonabile alle reti maxout e ReLU, caratterizzando la loro capacità di approssimare funzioni lineari a tratti continue attraverso un numero di regioni lineari che cresce esponenzialmente con la profondità, grazie al fatto che i meccanismi di self-attention implementano operazioni di tipo max e i livelli feedforward realizzano trasformazioni affini.

Linyan Gu, Lihua Yang, Feng Zhou2026-03-04🤖 cs.AI

Multi-Scale Adaptive Neighborhood Awareness Transformer For Graph Fraud Detection

Il paper propone MANDATE, un trasformatore multi-scala che migliora il rilevamento delle frodi nei grafi mitigando i limiti induttivi delle GNN attraverso codifiche posizionali, strategie di embedding differenziate per omofilia/eterofilia e fusione per grafi multi-relazionali.

Jiaqi Lv, Qingfeng Du, Yu Zhang + 2 more2026-03-04🤖 cs.AI

From Complex Dynamics to DynFormer: Rethinking Transformers for PDEs

Il paper presenta DynFormer, un operatore neurale innovativo che supera i limiti degli attuali Transformer applicati alle equazioni differenziali parziali integrando principi di dinamica complessa per separare le scale fisiche, riducendo drasticamente sia l'errore relativo che il consumo di memoria GPU attraverso meccanismi di attenzione strutturata e mixing frequenza locale-globale.

Pengyu Lai, Yixiao Chen, Dewu Yang + 3 more2026-03-04🌀 nlin

Joint Training Across Multiple Activation Sparsity Regimes

Questo studio propone una strategia di addestramento che cicla un singolo modello attraverso diversi regimi di sparsità delle attivazioni, dimostrando che tale approccio migliora la generalizzazione rispetto all'addestramento denso standard su CIFAR-10.

Haotian Wang2026-03-04🤖 cs.AI

Torus embeddings

Questo articolo dimostra che è possibile adattare i framework di deep learning per creare embedding con topologia toroidale intrinseca, offrendo un'alternativa stabile e performante agli embedding ipersferici che facilita l'implementazione efficiente su dispositivi embedded (TinyML) grazie alla loro rappresentazione naturale in interi con overflow.

Dan Stowell2026-03-04🤖 cs.LG

Channel-Adaptive Edge AI: Maximizing Inference Throughput by Adapting Computational Complexity to Channel States

Questo lavoro propone un modello analitico per l'accuratezza dell'inferenza end-to-end e un algoritmo di intelligenza artificiale adattiva al canale che massimizza il throughput di elaborazione ai bordi, adattando dinamicamente la compressione delle feature e la complessità del modello in base alle condizioni del canale.

Jierui Zhang, Jianhao Huang, Kaibin Huang2026-03-04🤖 cs.AI

Less Noise, Same Certificate: Retain Sensitivity for Unlearning

Questo articolo propone un approccio all'eliminazione certificata del machine learning che, sfruttando la definizione di "sensibilità di ritenzione" invece di quella globale basata sulla privacy differenziale, riduce il rumore necessario mantenendo inalterata la garanzia di eliminazione e migliorando l'utilità del modello.

Carolin Heinzler, Kasra Malihi, Amartya Sanyal2026-03-04🤖 cs.LG

Scalable Uncertainty Quantification for Black-Box Density-Based Clustering

Il paper presenta un nuovo framework scalabile per la quantificazione dell'incertezza nel clustering basato sulla densità, che combina il paradigma del posterior martingala con stimatori neurali di densità per propagare l'incertezza nella struttura dei cluster, garantendo consistenza frequentista e scalabilità su dati ad alta dimensionalità.

Nicola Bariletto, Stephen G. Walker2026-03-04📊 stat

A Covering Framework for Offline POMDPs Learning using Belief Space Metric

Questo articolo presenta un nuovo quadro di analisi per la valutazione fuori politica nei processi decisionali di Markov parzialmente osservabili (POMDP), che sfrutta la struttura metrica intrinseca dello spazio delle credenze per rilassare le ipotesi di copertura tradizionali e mitigare la maledizione dell'orizzonte e della memoria, ottenendo limiti di errore più stretti e una maggiore efficienza nel campionamento.

Youheng Zhu, Yiping Lu2026-03-04📊 stat

MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization

Questo lavoro propone MoD-DPO, un framework di ottimizzazione delle preferenze che mitiga le allucinazioni cross-modali nei modelli linguistici omni-modali introducendo regolarizzazioni specifiche per le modalità e penalità contro i pregiudizi testuali, migliorando così l'accuratezza percettiva e la robustezza del modello.

Ashutosh Chaubey, Jiacheng Pang, Mohammad Soleymani2026-03-04💬 cs.CL

Infinite dimensional generative sensing

Questo lavoro presenta un quadro teorico rigoroso per il sensing compresso generativo in spazi di Hilbert, dimostrando che la stabilità di recupero è garantita quando il numero di misurazioni è proporzionale alla dimensione intrinseca del prior, indipendentemente dalla dimensione ambientale, e validando tali risultati attraverso esperimenti numerici sull'equazione del flusso di Darcy.

Paolo Angella, Vito Paolo Pastore, Matteo Santacesaria2026-03-04⚡ eess

Understanding and Mitigating Dataset Corruption in LLM Steering

Questo studio dimostra che, sebbene il contrastive steering per i LLM sia robusto a una moderata corruzione dei dati, è vulnerabile ad alterazioni maliziose su larga scala, ma tale problema può essere efficacemente mitigato sostituendo il calcolo della media standard con un stimatore robusto della media.

Cullen Anderson, Narmeen Oozeer, Foad Namjoo + 3 more2026-03-04💬 cs.CL

← Precedente Successivo →