LLM4Cov: Execution-Aware Agentic Learning for High-coverage Testbench Generation

Il paper presenta LLM4Cov, un framework di apprendimento offline per agenti LLM che supera le limitazioni dei feedback di esecuzione costosi nella verifica hardware, permettendo a un modello compatto da 4B parametri di raggiungere prestazioni di copertura superiori rispetto ai modelli più grandi attraverso tecniche di curatela dati e sintesi guidate dalla politica.

Hejia Zhang, Zhongming Yu, Chia-Tung Ho + 3 more2026-02-27🤖 cs.AI

Scaling Laws for Precision in High-Dimensional Linear Regression

Questo lavoro stabilisce un quadro teorico per le leggi di scalabilità nell'addestramento a bassa precisione mediante regressione lineare ad alta dimensionalità, rivelando una dicotomia fondamentale in cui la quantizzazione moltiplicativa preserva la dimensione del modello mentre quella additiva la riduce, fornendo così basi per ottimizzare l'allocazione delle risorse computazionali.

Dechen Zhang, Xuan Tang, Yingyu Liang + 1 more2026-02-27📊 stat

On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference

Questo articolo stabilisce un collegamento teorico fondamentale tra la distillazione di reti casuali (RND), gli ensemble profondi e l'inferenza bayesiana nel limite di reti neurali infinite, dimostrando che l'incertezza misurata dalla RND equivale alla varianza predittiva degli ensemble e permettendo la costruzione di un modello "Bayesian RND" capace di campionare esattamente dalla distribuzione predittiva bayesiana.

Moritz A. Zanger, Yijun Wu, Pascal R. Van der Vaart + 2 more2026-02-27📊 stat

Not Just How Much, But Where: Decomposing Epistemic Uncertainty into Per-Class Contributions

Questo lavoro propone una decomposizione dell'incertezza epistemica in contributi per classe tramite un vettore Ck(x)C_k(x), che supera i limiti della mutua informazione scalare nelle applicazioni critiche per la sicurezza permettendo di distinguere l'ignoranza del modello tra classi diverse e migliorando significativamente la selezione delle previsioni, la rilevazione di distribuzioni fuori dal training e la robustezza al rumore.

Mame Diarra Toure, David A. Stephens2026-02-27📊 stat

Duel-Evolve: Reward-Free Test-Time Scaling via LLM Self-Preferences

Il paper presenta Duel-Evolve, un algoritmo di ottimizzazione evolutiva che migliora le prestazioni dei modelli linguistici durante il test senza reward esterni, utilizzando preferenze reciproche generate dal modello stesso combinate con un modello di Bradley-Terry bayesiano e il campionamento di Thompson doppio per guidare la ricerca in spazi di output discreti.

Sweta Karlekar, Carolina Zheng, Magnus Saebo + 5 more2026-02-27💬 cs.CL

Solving stiff dark matter equations via Jacobian Normalization with Physics-Informed Neural Networks

Il paper propone un metodo privo di iperparametri basato sulla normalizzazione delle risidui con la matrice jacobiana per migliorare l'addestramento delle PINN su equazioni differenziali rigide, dimostrando con successo la sua efficacia nel risolvere le equazioni di Boltzmann per la materia oscura e nel risolvere problemi inversi per inferire la sezione d'urto di annichilazione.

M. P. Bento, H. B. Câmara, J. R. Rocha + 1 more2026-02-27⚛️ hep-ph

Sample Complexity Bounds for Robust Mean Estimation with Mean-Shift Contamination

Questo lavoro risolve una questione aperta determinando i limiti di complessità del campione per la stima robusta della media in presenza di contaminazione da spostamento della media per distribuzioni generali, fornendo sia un algoritmo efficiente basato sull'analisi di Fourier e condizioni spettrali, sia un limite inferiore corrispondente.

Ilias Diakonikolas, Giannis Iakovidis, Daniel M. Kane + 1 more2026-02-27📊 stat

SmartChunk Retrieval: Query-Aware Chunk Compression with Planning for Efficient Document RAG

Il paper presenta SmartChunk, un framework di recupero adattivo per la RAG che ottimizza l'efficienza e l'accuratezza nella risposta alle domande su documenti lunghi utilizzando un pianificatore basato su reinforcement learning (STITCH) e un modulo di compressione per selezionare dinamicamente il livello di astrazione dei chunk più adatto a ciascuna query.

Xuechen Zhang, Koustava Goswami, Samet Oymak + 2 more2026-02-27💬 cs.CL

SEGB: Self-Evolved Generative Bidding with Local Autoregressive Diffusion

Il paper presenta SEGB, un framework di offerta generativa che supera i limiti delle politiche offline tradizionali sintetizzando stati futuri a breve termine e affinando autonomamente la strategia tramite un processo di auto-evoluzione guidato dal valore, ottenendo risultati superiori rispetto agli stati dell'arte sia su benchmark che in un test A/B su larga scala con un aumento del 10,19% del costo target.

Yulong Gao, Wan Jiang, Mingzhe Cao + 5 more2026-02-27🤖 cs.LG

Patient-Centered, Graph-Augmented Artificial Intelligence-Enabled Passive Surveillance for Early Stroke Risk Detection in High-Risk Individuals

Questo studio presenta un sistema di sorveglianza passiva basato sull'intelligenza artificiale e su un'analisi dei sintomi riportati dai pazienti, che utilizza un modello ibrido di apprendimento automatico per rilevare con alta precisione i rischi di ictus in individui diabetici, offrendo una finestra temporale preziosa per interventi clinici tempestivi.

Jiyeong Kim, Stephen P. Ma, Nirali Vora + 11 more2026-02-27🤖 cs.LG