Articoli verificati dagli autori

Per ogni articolo in questa pagina, almeno uno degli autori originali ha visto la nostra spiegazione divulgativa e se ne è occupato — confermandone l'accuratezza o richiedendo correzioni che abbiamo poi applicato. Una conferma non significa che gli autori approvino formalmente ogni frase, ma che la spiegazione è passata sotto gli occhi di chi ha scritto l'articolo.

607 articoli verificati dagli autori · 351–360 / 607

Key-Value Means

Il documento introduce Key-Value Means (KVM), un nuovo meccanismo di ricorrenza a blocchi per l'attenzione che unisce i vantaggi dei transformer e degli RNN lineari abilitando un addestramento efficiente e parallelizzabile a blocchi con crescita flessibile dello stato e tempo di prefill subquadratico, tutto ciò utilizzando operazioni standard e parametri aggiuntivi minimi.

Daniel Goldstein, Eugene Cheah2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

DP-LAC: Lightweight Adaptive Clipping for Differentially Private Federated Fine-tuning of Language Models

Il documento introduce DP-LAC, un metodo leggero per il fine-tuning federato differenzialmente privato dei modelli linguistici che stima e adatta in modo efficiente la soglia di clipping senza costi aggiuntivi per la privacy o regolazione degli iperparametri, ottenendo un miglioramento dell'accuratezza del 6,6% rispetto agli approcci esistenti.

Haaris Mehmood, Jie Xu, Karthikeyan Saravanan, Rogier Van Dalen, Mete Ozay2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

Test-Time Speculation

Questo articolo introduce Test-Time Speculation (TTS), un metodo di distillazione online che adatta continuamente un modello bozza durante l'inferenza utilizzando i segnali di verifica del modello target, superando così il degrado delle prestazioni degli speculatori esistenti su sequenze lunghe e migliorando significativamente le lunghezze di accettazione.

Avinash Kumar, Sujay Sanghavi, Poulami Das2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

Building Korean linguistic resource for NLU data generation of banking app CS dialog system

Questo articolo presenta la costruzione del Financial Annotated Dataset (FIAD), una risorsa linguistica coreana derivata da recensioni di applicazioni bancarie e da Local Grammar Graphs, utilizzata per generare dati di addestramento annotati che migliorano significativamente le prestazioni di vari modelli NLU nei sistemi dialogici di servizio clienti bancari.

Jeongwoo Yoon, On-yu Park, Changhoe Hwang, Gwanghoon Yoo, Eric Laporte, Jeesun Nam2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

NEO: No-Optimization Test-Time Adaptation through Latent Re-Centering

NEO è un metodo di adattamento al momento del test privo di iperparametri ed efficiente dal punto di vista computazionale che migliora la robustezza e la calibrazione del modello in caso di spostamenti della distribuzione riposizionando le incorporazioni dei dati target all'origine, ottenendo una precisione superiore su più dataset e dispositivi con un sovraccarico computazionale minimo.

Alexander Murphy, Michal Danilowski, Soumyajit Chatterjee, Abhirup Ghosh2026-05-12✓ Author reviewed ⓘ🤖 cs.LG

Scam2Prompt: A Scalable Framework for Auditing Malicious Scam Endpoints in Production LLMs

Il documento introduce Scam2Prompt, un framework scalabile che rivela una vulnerabilità di sicurezza critica e in peggioramento nei Large Language Models in produzione, in cui prompt automatizzati derivati da siti di truffa malevoli attivano con successo la generazione di codice dannoso in fino al 47,3% dei casi su più modelli, rendendo insufficienti le attuali misure di sicurezza come i guardrail e il RAG.

Zhiyang Chen, Tara Saba, Xun Deng, Xujie Si, Fan Long2026-05-12✓ Author reviewed ⓘ🤖 cs.AI

Distributional Learning of Context-Free Languages under Fixed Finite-Monoid Typing

Questo articolo stabilisce che i linguaggi context-free sostituibili sotto una tipizzazione finita di monoidi fissata possono essere identificati al limite da dati positivi, con la costruzione e l'aggiornamento dell'ipotesi che richiedono tempo polinomiale rispetto alla dimensione del campione per la classe generale fixed-h, mentre viene garantita una piena efficienza temporale e di dati (incluso un limite polinomiale sulla dimensione del campione caratteristico) per la sottoclasse lineare, sviluppando una teoria di ricostruzione tipata finita che utilizza una grammatica di ipotesi canonica derivata da un insieme finito di osservazioni.

Takayuki Kuriyama2026-05-12✓ Author reviewed ⓘ💻 cs

Entropy of pebble automata and space complexity

Il documento dimostra che la classe di complessità NL è distinta da logCFL, un risultato che implica ulteriormente le separazioni L ≠ Ptime e NL ≠ Ptime.

J. Andres Montoya2026-05-12✓ Author reviewed ⓘ💻 cs

Latent-Space Causal Discovery from Indirect Neuroimaging Observations

Questo articolo introduce INCAMA, un framework consapevole della fisica che combina l'inversione nello spazio latente con un encoder Mamba consapevole dei ritardi per recuperare strutture causali neurali dirette da segnali di neuroimmagine distorti, dimostrando prestazioni superiori rispetto alle linee di base sia nelle simulazioni che nei dati fMRI reali.

Sangyoon Bae, Miruna Oprescu, David Keetae Park, Shinjae Yoo, Jiook Cha2026-05-11✓ Author reviewed ⓘ🧬 q-bio

A Quadratic-Form Representation of the Scalar Casimir Trace from Codimension-Three Riesz Reduction

Questo lavoro stabilisce una rappresentazione in forma quadratica della traccia scalare di Casimir derivando un nucleo di Green indotto da una riduzione di Riesz di codimensione tre, il che permette all'aspettazione dell'energia di una sorgente gaussiana regolarizzata termicamente di riprodurre esattamente la traccia e conferma i risultati standard della parte finita nelle geometrie a piastre parallele di Dirichlet.

Irshadullah Khan, Bilal Khan2026-05-11✓ Author reviewed ⓘ🔢 math

← Precedente Successivo →