cs.LG articoli | Gist.Science

Leave-One-Out Prediction for General Hypothesis Classes

Il paper introduce la procedura di aggregazione MLSA per stabilire un'ineguaglianza oracolare moltiplicativa per l'errore di previsione leave-one-out in classi di ipotesi generali, dimostrando che tale errore è limitato da una costante moltiplicata per il rischio empirico minimo più un termine di complessità che scala come $O(d \log n)$ o $O(\log |H|)$ a seconda del contesto.

Jian Qian, Jiachen Xu2026-03-03📊 stat

TRAKNN: Efficient Trajectory Aware Spatiotemporal kNN for Rare Meteorological Trajectory Detection

Il paper presenta TRAKNN, un framework non supervisionato ed efficiente che utilizza un approccio kNN esatto basato sulla ricorrenza per rilevare traiettorie atmosferiche rare e geometricamente significative in grandi dataset spaziotemporali, superando le sfide computazionali tradizionali e identificando con successo anomalie coerenti con eventi meteorologici estremi.

Guillaume Coulaud, Davide Faranda2026-03-03📊 stat

Scaling Laws of SignSGD in Linear Regression: When Does It Outperform SGD?

Questo studio analizza le leggi di scalabilità di signSGD nella regressione lineare, dimostrando che, grazie a effetti unici di normalizzazione della deriva e rimodellamento del rumore, il metodo può superare SGD in termini di pendenza ottimale di calcolo in regimi dominati dal rumore, specialmente quando si utilizza un programma di apprendimento WSD con decadimento rapido delle caratteristiche.

Jihwan Kim, Dogyoon Song, Chulhee Yun2026-03-03📊 stat

Adam Converges Without Any Modification On Update Rules

Questo lavoro dimostra teoricamente che l'ottimizzatore Adam converge senza modifiche alle sue regole di aggiornamento, identificando una transizione di fase dipendente dal problema e dalla dimensione del batch nello spazio dei parametri $(\beta_1, \beta_2)$ e fornendo linee guida pratiche per la loro sintonizzazione che sono state validate empiricamente nel training di modelli linguistici su larga scala.

Yushun Zhang, Bingran Li, Congliang Chen + 2 more2026-03-03🔢 math

Orchestrating Multimodal DNN Workloads in Wireless Neural Processing

Questo articolo propone O-WiN, un framework che ottimizza l'esecuzione end-to-end dei carichi di lavoro DNN multimodali nei sistemi di elaborazione neurale wireless, dimostrando come l'interleaving delle trasmissioni e dell'esecuzione tramite l'algoritmo PACS riduca significativamente la latenza rispetto alla schedulazione sequenziale.

Sai Xu, Kai-Kit Wong, Yanan Du + 1 more2026-03-03⚡ eess

Near-Optimal Regret for KL-Regularized Multi-Armed Bandits

Questo lavoro caratterizza l'efficienza statistica dei bandit multi-braccio regolarizzati con KL fornendo il primo limite superiore di rimpianto con dipendenza lineare da $K$ e un limite inferiore quasi corrispondente, dimostrando così la near-ottimalità dell'algoritmo KL-UCB attraverso tutti i regimi di regolarizzazione.

Kaixuan Ji, Qingyue Zhao, Heyang Zhao + 2 more2026-03-03📊 stat

Instrumental and Proximal Causal Inference with Gaussian Processes

Il paper propone un quadro basato su Processi Gaussiani Decondizionati (DGP) per l'inferenza causale con variabili strumentali e proxy, colmando la lacuna nella quantificazione dell'incertezza epistemica e offrendo una soluzione unificata che garantisce precisione predittiva, selezione del modello e stime di incertezza ben calibrate in presenza di confondimento non osservato.

Yuqi Zhang, Krikamol Muandet, Dino Sejdinovic + 2 more2026-03-03📊 stat

Reservoir Subspace Injection for Online ICA under Top-n Whitening

Questo lavoro propone un controller di iniezione di sottospazio serbatoio (RSI) che, mitigando l'effetto di espulsione delle direzioni di passaggio causato dalla sbiancatura top- $n$ , ripristina le prestazioni dell'analisi delle componenti indipendenti online e ne migliora l'efficacia in scenari di miscelazione non lineare.

Wenjun Xiao, Yuda Bi, Vince D Calhoun2026-03-03📊 stat

Symbol-Equivariant Recurrent Reasoning Models

Il paper introduce i SE-RRM, un modello di ragionamento ricorrente che garantisce l'equivarianza simbolica a livello architetturale, migliorando le prestazioni e la capacità di generalizzazione su problemi come Sudoku e ARC-AGI rispetto ai modelli precedenti, pur utilizzando meno dati e parametri.

Richard Freinschlag, Timo Bertram, Erich Kobler + 2 more2026-03-03📊 stat

Conformal Policy Control

Il paper propone un metodo di controllo delle politiche basato sulla conformalità che, utilizzando una politica di riferimento sicura per regolare l'esplorazione di nuove strategie, garantisce limiti di rischio provati e prestazioni migliorate in ambienti ad alto rischio senza richiedere assunzioni sul modello o iperparametri.

Drew Prinster, Clara Fannjiang, Ji Won Park + 4 more2026-03-03📊 stat

Partial Causal Structure Learning for Valid Selective Conformal Inference under Interventions

Questo lavoro propone un metodo per l'inferenza conformale selettiva in contesti interventivi, combinando una teoria di copertura robusta alla contaminazione con un apprendimento causale parziale mirato a identificare le variabili non influenzate, garantendo così una copertura valida anche quando la struttura causale è sconosciuta.

Amir Asiaee, Kavey Aryan, James P. Long2026-03-03📊 stat

Optimizing Orbital Parameters of Satellites for a Global Quantum Network

Il presente lavoro dimostra che l'ottimizzazione dei parametri orbitali delle costellazioni satellitari tramite l'ottimizzazione bayesiana e gli algoritmi genetici permette di massimizzare significativamente i tassi di generazione di entanglement per una rete quantistica globale rispetto agli approcci naive.

Athul Ashok, Owen DePoint, Jackson MacDonald + 2 more2026-03-03⚛️ quant-ph

Neural quantum support vector data description for one-class classification

Questo articolo presenta NQSVDD, un framework ibrido classico-quantistico per la classificazione one-class che integra reti neurali classiche con circuiti quantistici variationali per ottenere prestazioni competitive o superiori rispetto ai metodi esistenti, mantenendo efficienza parametrica e robustezza sui dispositivi NISQ.

Changjae Im, Hyeondo Oh, Daniel K. Park2026-03-03⚛️ quant-ph

From Reachability to Learnability: Geometric Design Principles for Quantum Neural Networks

Questo studio ridefinisce la progettazione delle reti neurali quantistiche passando dalla semplice raggiungibilità degli stati alla geometria controllabile delle rappresentazioni nascoste, introducendo il criterio di quasi completa selettività locale (aCLS) per dimostrare che l'apprendimento delle caratteristiche richiede una dipendenza congiunta tra dati e pesi addestrabili, garantendo così migliori prestazioni con minori risorse computazionali.

Vishal S. Ngairangbam, Michael Spannowsky2026-03-03⚛️ quant-ph

Data Augmentation via Mixed Class Interpolation using Cycle-Consistent Generative Adversarial Networks Applied to Cross-Domain Imagery

Questo articolo propone e valuta un nuovo metodo di aumento dei dati basato sull'interpolazione di classi miste tramite CycleGAN (C2GMA) per generare immagini non visibili a partire da quelle visibili, migliorando significativamente l'accuratezza della classificazione nel dominio SAR rispetto alle strategie tradizionali.

Hiroshi Sasaki, Chris G. Willcocks, Toby P. Breckon2026-03-02🤖 cs.LG

Stationary Kernels and Gaussian Processes on Lie Groups and their Homogeneous Spaces I: the compact case

Questo lavoro presenta tecniche costruttive e pratiche per definire, calcolare e campionare processi gaussiani stazionari su spazi non euclidei derivanti da simmetrie, con un focus specifico sul caso compatto, rendendo tali modelli accessibili agli strumenti computazionali standard.

Iskander Azangulov, Andrei Smolensky, Alexander Terenin + 1 more2026-03-02🤖 cs.LG

A Fault Detection Scheme Utilizing Convolutional Neural Network for PV Solar Panels with High Accuracy

Questo articolo propone uno schema di rilevamento dei guasti per pannelli solari fotovoltaici basato su una rete neurale convoluzionale (CNN) addestrata, che raggiunge un'accuratezza del 91,1% nella classificazione binaria e dell'88,6% nella classificazione multi-classe, superando le prestazioni di studi precedenti.

Maryam Paparimoghadamborazjani, Amin Kazemi2026-03-02🤖 cs.LG

Assessment of Spatio-Temporal Predictors in the Presence of Missing and Heterogeneous Data

Questo articolo presenta un nuovo framework di analisi delle correlazioni dei residui per valutare l'ottimalità dei modelli di deep learning spaziotemporali in presenza di dati mancanti ed eterogenei, consentendo l'identificazione precisa delle regioni dove le prestazioni predittive possono essere migliorate.

Daniele Zambon, Cesare Alippi2026-03-02🤖 cs.LG

TimeMAE: Self-Supervised Representations of Time Series with Decoupled Masked Autoencoders

Il paper propone TimeMAE, un framework di apprendimento auto-supervisionato che migliora la rappresentazione delle serie temporali segmentando i dati in unità semantiche e utilizzando un autoencoder mascherato disaccoppiato per superare i limiti dei metodi esistenti, ottenendo prestazioni superiori in scenari con scarsità di etichette.

Mingyue Cheng, Xiaoyu Tao, Zhiding Liu + 4 more2026-03-02🤖 cs.LG

Gradient is All You Need? How Consensus-Based Optimization can be Interpreted as a Stochastic Relaxation of Gradient Descent

Questo articolo dimostra che l'ottimizzazione basata sul consenso (CBO) può essere interpretata come una rilassazione stocastica della discesa del gradiente, spiegando così il suo successo nel superare le barriere energetiche nelle funzioni non convesse e rivelando una natura intrinseca di discesa del gradiente anche nei metodi privi di derivata.

Konstantin Riedl, Timo Klock, Carina Geldhauser + 1 more2026-03-02🤖 cs.LG

← Precedente Successivo →