cs.LG articoli | Gist.Science

How Understanding Forecast Uncertainty Resolves the Explainability Problem in Machine Learning Models

Il paper sostiene che l'instabilità delle spiegazioni dei modelli di machine learning ai confini decisionali riflette un'alta incertezza di previsione, proponendo di verificare prima la disponibilità di una previsione affidabile prima di generare spiegazioni locali, e di ricorrere a modelli più semplici quando l'incertezza è troppo elevata.

Joseph L. Breeden2026-03-23🤖 cs.LG

Performance of Small Language Model Pretraining on FABRIC: An Empirical Study

Questo studio empirico valuta le prestazioni del preaddestramento di modelli linguistici di piccole dimensioni su un testbed accademico con GPU commerciali, dimostrando che l'uso di Alpa per ottimizzare congiuntamente il parallelismo intra-operatore e inter-operatore/pipeline garantisce le migliori prestazioni, specialmente in scenari con latenza di rete geografica.

Praveen Rao2026-03-23🤖 cs.AI

StealthRL: Reinforcement Learning Paraphrase Attacks for Multi-Detector Evasion of AI-Text Detectors

Il paper presenta StealthRL, un framework di reinforcement learning che utilizza l'ottimizzazione della politica relativa di gruppo (GRPO) per generare parafrasi che evadono con successo la rilevazione da parte di molteplici detector di testo AI preservando al contempo il significato semantico, rivelando così significative vulnerabilità condivise nelle attuali tecnologie di rilevamento.

Suraj Ranganath, Atharv Ramesh2026-03-23🤖 cs.LG

A Task-Centric Theory for Iterative Self-Improvement with Easy-to-Hard Curricula

Questo articolo propone una teoria basata sui compiti per il miglioramento iterativo dei modelli linguistici, dimostrando teoricamente e validando sperimentalmente che l'uso di curricula da facile a difficile garantisce risultati superiori rispetto all'addestramento su miscele fisse di compiti, fornendo al contempo garanzie a campione finito sul rendimento atteso.

Chenruo Liu, Yijun Dong, Yiqiu Shen, Qi Lei2026-03-23📊 stat

LHAW: Controllable Underspecification for Long-Horizon Tasks

Il paper introduce LHAW, un framework modulare e agnostico rispetto al task che trasforma sistematicamente flussi di lavoro a lungo termine in varianti sottodeterminate controllabili per valutare e migliorare la capacità degli agenti autonomi di gestire l'ambiguità e cercare chiarimenti necessari.

George Pu, Michael S. Lee, Udari Madhushani Sehwag, David J. Lee, Bryan Zhu, Yash Maurya, Mohit Raghavendra, Yuan Xue, Samuel Marc Denton2026-03-23💬 cs.CL

A Pragmatic Method for Comparing Clusterings with Overlaps and Outliers

Questo articolo propone una misura di similarità pragmatica per confrontare clusterizzazioni con sovrapposizioni e outlier, dimostrandone le proprietà desiderabili e la resistenza a comuni pregiudizi rispetto ad altri metodi di valutazione.

Ryan DeWolfe, Paweł Prałat, François Théberge2026-03-23🤖 cs.LG

Spectral Convolution on Orbifolds for Geometric Deep Learning

Questo articolo introduce il concetto di convoluzione spettrale su orbifold come nuovo blocco fondamentale per l'apprendimento geometrico su dati con tale struttura, illustrandone la teoria attraverso un esempio tratto dalla teoria musicale.

Tim Mangliers, Bernhard Mössner, Benjamin Himpel2026-03-23🤖 cs.LG

Federated Learning Playground

Il paper presenta il "Federated Learning Playground", una piattaforma interattiva basata sul browser che estende il TensorFlow Playground per insegnare i concetti fondamentali dell'apprendimento federato, consentendo agli utenti di sperimentare senza codice con distribuzioni di dati eterogenee, iperparametri e algoritmi di aggregazione attraverso visualizzazioni in tempo reale.

Bryan Shan, Alysa Ziying Tan, Han Yu2026-03-23🤖 cs.LG

On the Structural Non-Preservation of Epistemic Behaviour under Policy Transformation

Questo articolo dimostra che la dipendenza comportamentale degli agenti di apprendimento per rinforzo dalle informazioni interne non è preservata sotto aggregazione convessa, evidenziando come la distanza comportamentale si contragga durante le trasformazioni di politica e possa precedere il degrado delle prestazioni in caso di spostamento delle distribuzioni latenti.

Alexander Galozy2026-03-23🤖 cs.LG

The IJCNN 2025 Review Process

Questo articolo descrive il processo di revisione della conferenza IJCNN 2025, evidenziando una significativa crescita nelle sottomissioni, nei revisori e nei partecipanti, e illustrando strategie per la calibrazione dei punteggi al fine di eliminare i bias specifici dei revisori.

Michele Scarpiniti, Danilo Comminiello2026-03-23🤖 cs.LG

← Precedente Successivo →