cs.LG articoli | Gist.Science

LLM4Cov: Execution-Aware Agentic Learning for High-coverage Testbench Generation

Il paper presenta LLM4Cov, un framework di apprendimento offline per agenti LLM che supera le limitazioni dei feedback di esecuzione costosi nella verifica hardware, permettendo a un modello compatto da 4B parametri di raggiungere prestazioni di copertura superiori rispetto ai modelli più grandi attraverso tecniche di curatela dati e sintesi guidate dalla politica.

Hejia Zhang, Zhongming Yu, Chia-Tung Ho + 3 more2026-02-27🤖 cs.AI

Scaling Laws for Precision in High-Dimensional Linear Regression

Questo lavoro stabilisce un quadro teorico per le leggi di scalabilità nell'addestramento a bassa precisione mediante regressione lineare ad alta dimensionalità, rivelando una dicotomia fondamentale in cui la quantizzazione moltiplicativa preserva la dimensione del modello mentre quella additiva la riduce, fornendo così basi per ottimizzare l'allocazione delle risorse computazionali.

Dechen Zhang, Xuan Tang, Yingyu Liang + 1 more2026-02-27📊 stat

Soft Sequence Policy Optimization

Il paper introduce la Soft Sequence Policy Optimization (SSPO), un nuovo obiettivo di apprendimento per rinforzo off-policy che integra funzioni di gate morbide nei pesi di campionamento dell'importanza a livello di sequenza per migliorare la stabilità e le prestazioni nell'allineamento dei grandi modelli linguistici, in particolare nei compiti di ragionamento matematico.

Svetlana Glazyrina, Maksim Kryzhanovskiy, Roman Ischenko2026-02-27🤖 cs.AI

Decision MetaMamba: Enhancing Selective SSM in Offline RL with Heterogeneous Sequence Mixing

Il paper propone Decision MetaMamba, un'architettura che migliora le prestazioni dell'apprendimento per rinforzo offline sostituendo il mixer di token Mamba con un mixer di sequenze denso per preservare le informazioni locali e prevenire la perdita di dati, ottenendo risultati all'avanguardia con un numero ridotto di parametri.

Wall Kim, Chaeyoung Song, Hanul Kim2026-02-27🤖 cs.AI

On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference

Questo articolo stabilisce un collegamento teorico fondamentale tra la distillazione di reti casuali (RND), gli ensemble profondi e l'inferenza bayesiana nel limite di reti neurali infinite, dimostrando che l'incertezza misurata dalla RND equivale alla varianza predittiva degli ensemble e permettendo la costruzione di un modello "Bayesian RND" capace di campionare esattamente dalla distribuzione predittiva bayesiana.

Moritz A. Zanger, Yijun Wu, Pascal R. Van der Vaart + 2 more2026-02-27📊 stat

Latent Introspection: Models Can Detect Prior Concept Injections

Lo studio rivela che il modello Qwen 32B possiede una capacità latente di introspezione, permettendogli di rilevare e identificare concetti iniettati nel contesto precedente, un effetto che può essere notevolmente potenziato tramite prompt specifici senza aumentare significativamente i falsi positivi.

Theia Pearson-Vogel, Martin Vanek, Raymond Douglas + 1 more2026-02-27🤖 cs.AI

Not Just How Much, But Where: Decomposing Epistemic Uncertainty into Per-Class Contributions

Questo lavoro propone una decomposizione dell'incertezza epistemica in contributi per classe tramite un vettore $C_k(x)$ , che supera i limiti della mutua informazione scalare nelle applicazioni critiche per la sicurezza permettendo di distinguere l'ignoranza del modello tra classi diverse e migliorando significativamente la selezione delle previsioni, la rilevazione di distribuzioni fuori dal training e la robustezza al rumore.

Mame Diarra Toure, David A. Stephens2026-02-27📊 stat

Why Pass@k Optimization Can Degrade Pass@1: Prompt Interference in LLM Post-training

Questo studio teorico ed empirico dimostra che l'ottimizzazione diretta della metrica Pass@k nei modelli linguistici può degradare le prestazioni Pass@1 a causa di conflitti nei gradienti indotti dall'interferenza negativa tra prompt, spiegando il trade-off osservato tra l'uso di più campioni e l'affidabilità della singola risposta.

Anas Barakat, Souradip Chakraborty, Khushbu Pahwa + 1 more2026-02-27🤖 cs.AI

Muon+: Towards Better Muon via One Additional Normalization Step

Il lavoro propone Muon+, un'ottimizzazione semplice ma efficace dell'ottimizzatore Muon che introduce un passo di normalizzazione aggiuntivo dopo l'ortogonalizzazione, dimostrando attraverso estesi esperimenti di pre-addestramento su modelli di grandi dimensioni un miglioramento coerente delle prestazioni rispetto al Muon originale.

Ruijie Zhang, Yequan Zhao, Ziyue Liu + 2 more2026-02-27🤖 cs.LG

Duel-Evolve: Reward-Free Test-Time Scaling via LLM Self-Preferences

Il paper presenta Duel-Evolve, un algoritmo di ottimizzazione evolutiva che migliora le prestazioni dei modelli linguistici durante il test senza reward esterni, utilizzando preferenze reciproche generate dal modello stesso combinate con un modello di Bradley-Terry bayesiano e il campionamento di Thompson doppio per guidare la ricerca in spazi di output discreti.

Sweta Karlekar, Carolina Zheng, Magnus Saebo + 5 more2026-02-27💬 cs.CL

Solving stiff dark matter equations via Jacobian Normalization with Physics-Informed Neural Networks

Il paper propone un metodo privo di iperparametri basato sulla normalizzazione delle risidui con la matrice jacobiana per migliorare l'addestramento delle PINN su equazioni differenziali rigide, dimostrando con successo la sua efficacia nel risolvere le equazioni di Boltzmann per la materia oscura e nel risolvere problemi inversi per inferire la sezione d'urto di annichilazione.

M. P. Bento, H. B. Câmara, J. R. Rocha + 1 more2026-02-27⚛️ hep-ph

Sample Complexity Bounds for Robust Mean Estimation with Mean-Shift Contamination

Questo lavoro risolve una questione aperta determinando i limiti di complessità del campione per la stima robusta della media in presenza di contaminazione da spostamento della media per distribuzioni generali, fornendo sia un algoritmo efficiente basato sull'analisi di Fourier e condizioni spettrali, sia un limite inferiore corrispondente.

Ilias Diakonikolas, Giannis Iakovidis, Daniel M. Kane + 1 more2026-02-27📊 stat

SQaLe: A Large Text-to-SQL Corpus Grounded in Real Schemas

Il paper introduce SQaLe, un vasto corpus semi-sintetico di testo-SQL composto da oltre 517.000 triple ad alta qualità derivate da 135.875 schemi reali, progettato per superare le attuali limitazioni dei dataset e favorire lo sviluppo di modelli più generalizzabili.

Cornelius Wolff, Daniel Gomm, Madelon Hulsebos2026-02-27💬 cs.CL

SmartChunk Retrieval: Query-Aware Chunk Compression with Planning for Efficient Document RAG

Il paper presenta SmartChunk, un framework di recupero adattivo per la RAG che ottimizza l'efficienza e l'accuratezza nella risposta alle domande su documenti lunghi utilizzando un pianificatore basato su reinforcement learning (STITCH) e un modulo di compressione per selezionare dinamicamente il livello di astrazione dei chunk più adatto a ciascuna query.

Xuechen Zhang, Koustava Goswami, Samet Oymak + 2 more2026-02-27💬 cs.CL

SEGB: Self-Evolved Generative Bidding with Local Autoregressive Diffusion

Il paper presenta SEGB, un framework di offerta generativa che supera i limiti delle politiche offline tradizionali sintetizzando stati futuri a breve termine e affinando autonomamente la strategia tramite un processo di auto-evoluzione guidato dal valore, ottenendo risultati superiori rispetto agli stati dell'arte sia su benchmark che in un test A/B su larga scala con un aumento del 10,19% del costo target.

Yulong Gao, Wan Jiang, Mingzhe Cao + 5 more2026-02-27🤖 cs.LG

Patient-Centered, Graph-Augmented Artificial Intelligence-Enabled Passive Surveillance for Early Stroke Risk Detection in High-Risk Individuals

Questo studio presenta un sistema di sorveglianza passiva basato sull'intelligenza artificiale e su un'analisi dei sintomi riportati dai pazienti, che utilizza un modello ibrido di apprendimento automatico per rilevare con alta precisione i rischi di ictus in individui diabetici, offrendo una finestra temporale preziosa per interventi clinici tempestivi.

Jiyeong Kim, Stephen P. Ma, Nirali Vora + 11 more2026-02-27🤖 cs.LG

An Adaptive Multichain Blockchain: A Multiobjective Optimization Approach

Questo paper propone un approccio di ottimizzazione multiobiettivo per configurare blockchain multicanale adattive, risolvendo off-chain un problema di allocazione delle risorse tra più agenti per massimizzare l'utilità complessiva e garantire scalabilità, equità e stabilità.

Nimrod Talmon, Haim Zysberg2026-02-27🤖 cs.LG

FM-RME: Foundation Model Empowered Radio Map Estimation

Il documento propone FM-RME, un modello fondazionale che combina l'estrazione di caratteristiche geometriche consapevoli e una strategia di pre-addestramento auto-supervisionato per stimare mappe radio multidimensionali con capacità di generalizzazione zero-shot, superando i limiti dei metodi tradizionali basati sui dati.

Dong Yang, Yue Wang, Songyang Zhang + 3 more2026-02-27⚡ eess

CrossLLM-Mamba: Multimodal State Space Fusion of LLMs for RNA Interaction Prediction

Il paper presenta CrossLLM-Mamba, un nuovo framework che utilizza encoder Mamba bidirezionali per modellare le interazioni RNA come transizioni dinamiche di stato, superando le strategie di fusione statiche e ottenendo prestazioni all'avanguardia nella previsione di interazioni RNA-proteina, RNA-molecola piccola e RNA-RNA.

Rabeya Tus Sadia, Qiang Ye, Qiang Cheng2026-02-27🧬 q-bio

VAE-MS: An Asymmetric Variational Autoencoder for Mutational Signature Extraction

Il paper presenta VAE-MS, un nuovo modello di autoencoder variazionale asimmetrico che combina architetture non lineari e metodi probabilistici per estrarre firme mutazionali con una maggiore accuratezza sui dati reali rispetto agli standard attuali.

Ida Egendal, Rasmus Froberg Brøndum, Dan J Woodcock + 2 more2026-02-27🧬 q-bio

← Precedente Successivo →