Beyond RLHF and NLHF: Population-Proportional Alignment under an Axiomatic Framework

Questo lavoro propone un nuovo framework di allineamento delle preferenze basato sulla teoria della scelta sociale che, inferendo la distribuzione reale degli evaluatori dai dati di confronto, garantisce un allineamento proporzionale alla popolazione e riduce la manipolabilità strategica, superando i limiti dei metodi convenzionali come RLHF e NLHF.

Kihyun Kim, Jiawei Zhang, Asuman Ozdaglar + 1 more2026-03-03🤖 cs.AI

Accuracy-Efficiency Trade-Offs in Spiking Neural Networks: A Lempel-Ziv Complexity Perspective on Learning Rules

Questo studio analizza i compromessi tra accuratezza ed efficienza nell'addestramento delle reti neurali a impulsi, dimostrando che l'uso della complessità di Lempel-Ziv come descrittore temporale rivela come le regole di apprendimento bio-ispirate offrano un migliore equilibrio rispetto ai metodi basati su gradienti per il riconoscimento di pattern temporali.

Zofia Rudnicka, Janusz Szczepanski, Agnieszka Pregowska2026-03-03🧬 q-bio

When Is Diversity Rewarded in Cooperative Multi-Agent Learning?

Questo studio teorico e sperimentale, basato sull'apprendimento per rinforzo multi-agente e su un nuovo algoritmo di ricerca parametrica, dimostra che la diversità comportamentale nei team cooperativi viene premiata quando la curvatura delle funzioni di ricompensa globale soddisfa specifici criteri di convessità, fornendo così una guida per la progettazione di obiettivi che favoriscono l'eterogeneità.

Michael Amir, Matteo Bettini, Amanda Prorok2026-03-03🤖 cs.AI