cs.LG articoli | Gist.Science

mCLM: A Modular Chemical Language Model that Generates Functional and Makeable Molecules

Il paper presenta mCLM, un modello linguistico chimico modulare che, tokenizzando le molecole in blocchi funzionali compatibili con la sintesi automatizzata, genera nuovi candidati farmacologici con proprietà migliorate e un'accessibilità sintetica superiore rispetto ai metodi esistenti, inclusi i modelli di grandi dimensioni come GPT-5.

Carl Edwards, Chi Han, Gawon Lee + 11 more2026-03-03🧬 q-bio

Adversarially Pretrained Transformers May Be Universally Robust In-Context Learners

Questo studio teorico dimostra che i transformer preaddestrati in modo avversario possono agire come modelli fondazionali universalmente robusti, adattandosi a compiti di classificazione non visti tramite apprendimento contestuale da esempi puliti senza necessità di ulteriore addestramento avversario.

Soichiro Kumano, Hiroshi Kera, Toshihiko Yamasaki2026-03-03📊 stat

GradPCA: Leveraging NTK Alignment for Reliable Out-of-Distribution Detection

Il paper introduce GradPCA, un metodo per il rilevamento di dati fuori distribuzione (OOD) che sfrutta la struttura a basso rango dei gradienti delle reti neurali indotta dall'allineamento NTK, applicando l'analisi delle componenti principali (PCA) alle medie dei gradienti per ottenere prestazioni più coerenti e fornendo un quadro teorico che evidenzia il ruolo cruciale della qualità delle feature.

Mariia Seleznova, Hung-Hsu Chou, Claudio Mayrink Verdun + 1 more2026-03-03🤖 cs.LG

Not All Models Suit Expert Offloading: On Local Routing Consistency of Mixture-of-Expert Models

Questo studio analizza la consistenza del routing locale nei modelli Mixture-of-Experts, proponendo nuove metriche per valutare l'efficacia dell'offloading degli esperti e rivelando come il bilanciamento del carico locale e le scelte architetturali influenzino le prestazioni su dispositivi con memoria limitata.

Jingcong Liang, Siyuan Wang, Miren Tian + 3 more2026-03-03🤖 cs.AI

ICYM2I: The illusion of multimodal informativeness under missingness

Il paper introduce ICYM2I, un framework basato sulla ponderazione per probabilità inversa che corregge i pregiudizi nella stima del guadagno informativo nel machine learning multimodale causati dai cambiamenti nei modelli di dati mancanti tra ambienti di origine e target.

Young Sang Choi, Vincent Jeanselme, Pierre Elias + 1 more2026-03-03📊 stat

NFT: Bridging Supervised Learning and Reinforcement Learning in Math Reasoning

Il paper propone la Negative-aware Fine-Tuning (NFT), un approccio di apprendimento supervisionato che, modellando le risposte errate generate internamente come una politica implicita, permette ai modelli linguistici di migliorare autonomamente nelle capacità di ragionamento matematico, colmando il divario tra metodi supervisionati e di apprendimento per rinforzo e dimostrando risultati paragonabili o superiori agli algoritmi RL più avanzati.

Huayu Chen, Kaiwen Zheng, Qinsheng Zhang + 8 more2026-03-03💬 cs.CL

Discovering and Steering Interpretable Concepts in Large Generative Music Models

Questo paper introduce un metodo scalabile basato su autoencoder sparsi per scoprire e guidare concetti interpretabili nei modelli generativi musicali, rivelando sia principi musicali familiari che pattern coerenti ma non codificati che sfuggono alle tradizionali teorie analitiche.

Nikhil Singh, Manuel Cherep, Pattie Maes2026-03-03⚡ eess

SuperMAN: Interpretable and Expressive Networks over Temporally Sparse Heterogeneous Data

Il paper propone SuperMAN, un framework interpretabile e ad alta espressività basato su grafici impliciti per apprendere da dati temporali eterogenei e sparsi, ottenendo prestazioni all'avanguardia in compiti critici come la previsione dell'insorgenza del morbo di Crohn e il rilevamento di fake news.

Maya Bechler-Speicher, Andrea Zerio, Maor Huri + 5 more2026-03-03🤖 cs.LG

Learning to Reason without External Rewards

Il paper presenta Intuitor, un metodo di apprendimento per rinforzo che utilizza la "self-certainty" (autocertezza) intrinseca del modello come unico segnale di ricompensa, permettendo ai grandi modelli linguistici di migliorare il ragionamento e la generalizzazione in modo completamente non supervisionato senza dipendere da ricompense esterne o dati etichettati.

Xuandong Zhao, Zhewei Kang, Aosong Feng + 2 more2026-03-03💬 cs.CL

Probabilistic Kernel Function for Fast Angle Testing

Questo articolo propone nuove funzioni kernel probabilistiche basate su proiezioni deterministiche per il test degli angoli in spazi ad alta dimensionalità, dimostrando sperimentalmente che superano i metodi basati su distribuzioni gaussiane e offrono un throughput di ricerca 2,5-3 volte superiore rispetto all'algoritmo HNSW.

Kejing Lu, Chuan Xiao, Yoshiharu Ishikawa2026-03-03🤖 cs.AI

PLANETALIGN: A Comprehensive Python Library for Benchmarking Network Alignment

Il documento presenta PLANETALIGN, una libreria Python completa che facilita lo sviluppo e il benchmarking sistematico dei metodi di allineamento di rete attraverso un ricco insieme di dataset, algoritmi e pipeline di valutazione standardizzate.

Qi Yu, Zhichen Zeng, Yuchen Yan + 5 more2026-03-03🤖 cs.LG

EquiReg: Equivariance Regularized Diffusion for Inverse Problems

Il paper propone EquiReg, un framework plug-and-play che migliora la risoluzione dei problemi inversi tramite modelli di diffusione, regolarizzando le traiettorie di campionamento verso il manifold dei dati sfruttando funzioni equivarianti per ottenere ricostruzioni di alta qualità anche con pochi passi di campionamento.

Bahareh Tolooshams, Aditi Chandrashekar, Rayhan Zirvi + 4 more2026-03-03🤖 cs.AI

AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning

Il paper presenta AReaL, un sistema di apprendimento per rinforzo completamente asincrono che disaccoppia generazione e addestramento per massimizzare l'utilizzo delle GPU e accelerare l'addestramento dei modelli linguistici su compiti di ragionamento, ottenendo un miglioramento delle prestazioni fino a 2,77 volte rispetto ai sistemi sincroni.

Wei Fu, Jiaxuan Gao, Xujie Shen + 10 more2026-03-03🤖 cs.AI

General Protein Pretraining or Domain-Specific Designs? Benchmarking Protein Modeling on Realistic Applications

Questo lavoro introduce Protap, un benchmark completo che dimostra come, per applicazioni proteiche realistiche e specifiche, i modelli supervisionati su piccoli dataset, l'integrazione di informazioni strutturali e i prior biologici di dominio possano spesso superare le prestazioni dei grandi modelli preaddestrati su sequenze.

Shuo Yan, Yuliang Yan, Bin Ma + 6 more2026-03-03🧬 q-bio

FAuNO: Semi-Asynchronous Federated Reinforcement Learning Framework for Task Offloading in Edge Systems

Il paper presenta FAuNO, un framework di apprendimento per rinforzo federato asincrono che ottimizza l'offloading dei compiti nei sistemi edge attraverso un'architettura attore-critico, dimostrando prestazioni superiori rispetto alle soluzioni esistenti nel ridurre latenza e perdita di dati.

Frederico Metelo, Alexandre Oliveira, Stevo Racković + 2 more2026-03-03🤖 cs.AI

QKV Projections Require a Fraction of Their Memory

Il paper propone PAMM, una tecnica di compressione tensoriale che riduce l'occupazione di memoria delle proiezioni QKV negli strati di attenzione fino a 512 volte senza compromettere le prestazioni del modello, rendendola un metodo complementare e pratico per l'addestramento efficiente di LLM.

Malik Khalaf, Yara Shamshoum, Nitzan Hodos + 2 more2026-03-03🤖 cs.LG

Log-Linear Attention

Questo articolo introduce l'attenzione log-lineare, un meccanismo che bilancia l'efficienza computazionale delle attention lineari con l'espressività delle attention softmax sostituendo lo stato nascosto fisso con un insieme che cresce logaritmicamente, permettendo così un addestramento parallelo efficiente e prestazioni competitive in architetture come Mamba-2 e Gated DeltaNet.

Han Guo, Songlin Yang, Tarushii Goel + 3 more2026-03-03🤖 cs.LG

Beyond RLHF and NLHF: Population-Proportional Alignment under an Axiomatic Framework

Questo lavoro propone un nuovo framework di allineamento delle preferenze basato sulla teoria della scelta sociale che, inferendo la distribuzione reale degli evaluatori dai dati di confronto, garantisce un allineamento proporzionale alla popolazione e riduce la manipolabilità strategica, superando i limiti dei metodi convenzionali come RLHF e NLHF.

Kihyun Kim, Jiawei Zhang, Asuman Ozdaglar + 1 more2026-03-03🤖 cs.AI

Accuracy-Efficiency Trade-Offs in Spiking Neural Networks: A Lempel-Ziv Complexity Perspective on Learning Rules

Questo studio analizza i compromessi tra accuratezza ed efficienza nell'addestramento delle reti neurali a impulsi, dimostrando che l'uso della complessità di Lempel-Ziv come descrittore temporale rivela come le regole di apprendimento bio-ispirate offrano un migliore equilibrio rispetto ai metodi basati su gradienti per il riconoscimento di pattern temporali.

Zofia Rudnicka, Janusz Szczepanski, Agnieszka Pregowska2026-03-03🧬 q-bio

Meta-Adaptive Prompt Distillation for Few-Shot Visual Question Answering

Il paper propone un approccio di meta-apprendimento che migliora le capacità few-shot dei Large Multimodal Models per il Visual Question Answering distillando prompt soft da caratteristiche visive rilevanti tramite un modulo mappatore di attenzione, superando significativamente sia l'apprendimento in contesto che i metodi di finetuning efficiente.

Akash Gupta, Amos Storkey, Mirella Lapata2026-03-03💬 cs.CL

← Precedente Successivo →