GradPCA: Leveraging NTK Alignment for Reliable Out-of-Distribution Detection

Il paper introduce GradPCA, un metodo per il rilevamento di dati fuori distribuzione (OOD) che sfrutta la struttura a basso rango dei gradienti delle reti neurali indotta dall'allineamento NTK, applicando l'analisi delle componenti principali (PCA) alle medie dei gradienti per ottenere prestazioni più coerenti e fornendo un quadro teorico che evidenzia il ruolo cruciale della qualità delle feature.

Mariia Seleznova, Hung-Hsu Chou, Claudio Mayrink Verdun + 1 more2026-03-03🤖 cs.LG

NFT: Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

Il paper propone la Negative-aware Fine-Tuning (NFT), un approccio di apprendimento supervisionato che, modellando le risposte errate generate internamente come una politica implicita, permette ai modelli linguistici di migliorare autonomamente nelle capacità di ragionamento matematico, colmando il divario tra metodi supervisionati e di apprendimento per rinforzo e dimostrando risultati paragonabili o superiori agli algoritmi RL più avanzati.

Huayu Chen, Kaiwen Zheng, Qinsheng Zhang + 8 more2026-03-03💬 cs.CL

Beyond RLHF and NLHF: Population-Proportional Alignment under an Axiomatic Framework

Questo lavoro propone un nuovo framework di allineamento delle preferenze basato sulla teoria della scelta sociale che, inferendo la distribuzione reale degli evaluatori dai dati di confronto, garantisce un allineamento proporzionale alla popolazione e riduce la manipolabilità strategica, superando i limiti dei metodi convenzionali come RLHF e NLHF.

Kihyun Kim, Jiawei Zhang, Asuman Ozdaglar + 1 more2026-03-03🤖 cs.AI

Accuracy-Efficiency Trade-Offs in Spiking Neural Networks: A Lempel-Ziv Complexity Perspective on Learning Rules

Questo studio analizza i compromessi tra accuratezza ed efficienza nell'addestramento delle reti neurali a impulsi, dimostrando che l'uso della complessità di Lempel-Ziv come descrittore temporale rivela come le regole di apprendimento bio-ispirate offrano un migliore equilibrio rispetto ai metodi basati su gradienti per il riconoscimento di pattern temporali.

Zofia Rudnicka, Janusz Szczepanski, Agnieszka Pregowska2026-03-03🧬 q-bio