cs.LG articoli | Gist.Science

SuperMAN: Interpretable and Expressive Networks over Temporally Sparse Heterogeneous Data

Il paper propone SuperMAN, un framework interpretabile e ad alta espressività basato su grafici impliciti per apprendere da dati temporali eterogenei e sparsi, ottenendo prestazioni all'avanguardia in compiti critici come la previsione dell'insorgenza del morbo di Crohn e il rilevamento di fake news.

Maya Bechler-Speicher, Andrea Zerio, Maor Huri + 5 more2026-03-03🤖 cs.LG

Learning to Reason without External Rewards

Il paper presenta Intuitor, un metodo di apprendimento per rinforzo che utilizza la "self-certainty" (autocertezza) intrinseca del modello come unico segnale di ricompensa, permettendo ai grandi modelli linguistici di migliorare il ragionamento e la generalizzazione in modo completamente non supervisionato senza dipendere da ricompense esterne o dati etichettati.

Xuandong Zhao, Zhewei Kang, Aosong Feng + 2 more2026-03-03💬 cs.CL

Probabilistic Kernel Function for Fast Angle Testing

Questo articolo propone nuove funzioni kernel probabilistiche basate su proiezioni deterministiche per il test degli angoli in spazi ad alta dimensionalità, dimostrando sperimentalmente che superano i metodi basati su distribuzioni gaussiane e offrono un throughput di ricerca 2,5-3 volte superiore rispetto all'algoritmo HNSW.

Kejing Lu, Chuan Xiao, Yoshiharu Ishikawa2026-03-03🤖 cs.AI

PLANETALIGN: A Comprehensive Python Library for Benchmarking Network Alignment

Il documento presenta PLANETALIGN, una libreria Python completa che facilita lo sviluppo e il benchmarking sistematico dei metodi di allineamento di rete attraverso un ricco insieme di dataset, algoritmi e pipeline di valutazione standardizzate.

Qi Yu, Zhichen Zeng, Yuchen Yan + 5 more2026-03-03🤖 cs.LG

EquiReg: Equivariance Regularized Diffusion for Inverse Problems

Il paper propone EquiReg, un framework plug-and-play che migliora la risoluzione dei problemi inversi tramite modelli di diffusione, regolarizzando le traiettorie di campionamento verso il manifold dei dati sfruttando funzioni equivarianti per ottenere ricostruzioni di alta qualità anche con pochi passi di campionamento.

Bahareh Tolooshams, Aditi Chandrashekar, Rayhan Zirvi + 4 more2026-03-03🤖 cs.AI

AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning

Il paper presenta AReaL, un sistema di apprendimento per rinforzo completamente asincrono che disaccoppia generazione e addestramento per massimizzare l'utilizzo delle GPU e accelerare l'addestramento dei modelli linguistici su compiti di ragionamento, ottenendo un miglioramento delle prestazioni fino a 2,77 volte rispetto ai sistemi sincroni.

Wei Fu, Jiaxuan Gao, Xujie Shen + 10 more2026-03-03🤖 cs.AI

General Protein Pretraining or Domain-Specific Designs? Benchmarking Protein Modeling on Realistic Applications

Questo lavoro introduce Protap, un benchmark completo che dimostra come, per applicazioni proteiche realistiche e specifiche, i modelli supervisionati su piccoli dataset, l'integrazione di informazioni strutturali e i prior biologici di dominio possano spesso superare le prestazioni dei grandi modelli preaddestrati su sequenze.

Shuo Yan, Yuliang Yan, Bin Ma + 6 more2026-03-03🧬 q-bio

FAuNO: Semi-Asynchronous Federated Reinforcement Learning Framework for Task Offloading in Edge Systems

Il paper presenta FAuNO, un framework di apprendimento per rinforzo federato asincrono che ottimizza l'offloading dei compiti nei sistemi edge attraverso un'architettura attore-critico, dimostrando prestazioni superiori rispetto alle soluzioni esistenti nel ridurre latenza e perdita di dati.

Frederico Metelo, Alexandre Oliveira, Stevo Racković + 2 more2026-03-03🤖 cs.AI

QKV Projections Require a Fraction of Their Memory

Il paper propone PAMM, una tecnica di compressione tensoriale che riduce l'occupazione di memoria delle proiezioni QKV negli strati di attenzione fino a 512 volte senza compromettere le prestazioni del modello, rendendola un metodo complementare e pratico per l'addestramento efficiente di LLM.

Malik Khalaf, Yara Shamshoum, Nitzan Hodos + 2 more2026-03-03🤖 cs.LG

Log-Linear Attention

Questo articolo introduce l'attenzione log-lineare, un meccanismo che bilancia l'efficienza computazionale delle attention lineari con l'espressività delle attention softmax sostituendo lo stato nascosto fisso con un insieme che cresce logaritmicamente, permettendo così un addestramento parallelo efficiente e prestazioni competitive in architetture come Mamba-2 e Gated DeltaNet.

Han Guo, Songlin Yang, Tarushii Goel + 3 more2026-03-03🤖 cs.LG

Beyond RLHF and NLHF: Population-Proportional Alignment under an Axiomatic Framework

Questo lavoro propone un nuovo framework di allineamento delle preferenze basato sulla teoria della scelta sociale che, inferendo la distribuzione reale degli evaluatori dai dati di confronto, garantisce un allineamento proporzionale alla popolazione e riduce la manipolabilità strategica, superando i limiti dei metodi convenzionali come RLHF e NLHF.

Kihyun Kim, Jiawei Zhang, Asuman Ozdaglar + 1 more2026-03-03🤖 cs.AI

Accuracy-Efficiency Trade-Offs in Spiking Neural Networks: A Lempel-Ziv Complexity Perspective on Learning Rules

Questo studio analizza i compromessi tra accuratezza ed efficienza nell'addestramento delle reti neurali a impulsi, dimostrando che l'uso della complessità di Lempel-Ziv come descrittore temporale rivela come le regole di apprendimento bio-ispirate offrano un migliore equilibrio rispetto ai metodi basati su gradienti per il riconoscimento di pattern temporali.

Zofia Rudnicka, Janusz Szczepanski, Agnieszka Pregowska2026-03-03🧬 q-bio

Meta-Adaptive Prompt Distillation for Few-Shot Visual Question Answering

Il paper propone un approccio di meta-apprendimento che migliora le capacità few-shot dei Large Multimodal Models per il Visual Question Answering distillando prompt soft da caratteristiche visive rilevanti tramite un modulo mappatore di attenzione, superando significativamente sia l'apprendimento in contesto che i metodi di finetuning efficiente.

Akash Gupta, Amos Storkey, Mirella Lapata2026-03-03💬 cs.CL

ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning

Il paper presenta ProteinZero, un framework di apprendimento per rinforzo online che permette ai modelli generativi di proteine di auto-migliorarsi in modo scalabile ed efficiente, superando i metodi esistenti grazie a un processo di ottimizzazione multi-obiettivo che combina guida strutturale, predizione di stabilità e regolarizzazione della diversità.

Ziwen Wang, Jiajun Fan, Ruihan Guo + 3 more2026-03-03🧬 q-bio

Intention-Conditioned Flow Occupancy Models

Il paper propone gli InFOM, modelli di occupazione basati sul flow matching e condizionati all'intenzione dell'utente, che sfruttano il pre-addestramento su larga scala per migliorare l'efficienza dei campioni e la robustezza nell'apprendimento per rinforzo, ottenendo significativi miglioramenti nelle prestazioni su numerosi benchmark.

Chongyi Zheng, Seohong Park, Sergey Levine + 1 more2026-03-03🤖 cs.AI

Branched Schrödinger Bridge Matching

Il paper introduce BranchSBM, un nuovo framework che supera i limiti dei metodi generativi esistenti permettendo di modellare traiettorie intermedie ramificate da una distribuzione iniziale verso molteplici distribuzioni target, risultando essenziale per applicazioni come la navigazione multi-percorso e la simulazione di biforcazioni nel destino cellulare.

Sophia Tang, Yinuo Zhang, Alexander Tong + 1 more2026-03-03🧬 q-bio

When Is Diversity Rewarded in Cooperative Multi-Agent Learning?

Questo studio teorico e sperimentale, basato sull'apprendimento per rinforzo multi-agente e su un nuovo algoritmo di ricerca parametrica, dimostra che la diversità comportamentale nei team cooperativi viene premiata quando la curvatura delle funzioni di ricompensa globale soddisfa specifici criteri di convessità, fornendo così una guida per la progettazione di obiettivi che favoriscono l'eterogeneità.

Michael Amir, Matteo Bettini, Amanda Prorok2026-03-03🤖 cs.AI

Monotone Classification with Relative Approximations

Questo articolo presenta il primo studio che stabilisce limiti superiori e inferiori quasi corrispondenti per il costo minimo necessario a identificare un classificatore monotono con un errore relativo al massimo $(1 + \epsilon)$ volte quello ottimale, superando i precedenti risultati basati su fattori di errore assoluti.

Yufei Tao2026-03-03🤖 cs.LG

VINCIE: Unlocking In-context Image Editing from Video

Il paper introduce VINCIE, un modello basato su trasformatori di diffusione che impara l'editing di immagini in contesto direttamente da video, superando le dipendenze da pipeline specifiche e ottenendo risultati all'avanguardia su benchmark multi-turno.

Leigang Qu, Feng Cheng, Ziyan Yang + 7 more2026-03-03💬 cs.CL

Equitable Electronic Health Record Prediction with FAME: Fairness-Aware Multimodal Embedding

Il paper introduce FAME, un framework di embedding multimodale consapevole dell'equità che ottimizza simultaneamente le prestazioni predittive e la giustizia nei dati delle cartelle cliniche elettroniche pesando dinamicamente i diversi modali in base al loro contributo all'equità.

Nikkie Hooman, Zhongjie Wu, Eric C. Larson + 1 more2026-03-03💬 cs.CL

← Precedente Successivo →