cs.LG articoli | Gist.Science

Integrating Homomorphic Encryption and Synthetic Data in FL for Privacy and Learning Quality

Questo lavoro presenta Alt-FL, un approccio di apprendimento federato che integra crittografia omomorfa e dati sintetici in un'alternanza strategica per migliorare l'accuratezza del modello, garantire la privacy dei dati e ridurre significativamente i costi computazionali.

Yenan Wang, Carla Fabiana Chiasserini, Elad Michael Schiller2026-03-04🤖 cs.LG

LAGO: A Local-Global Optimization Framework Combining Trust Region Methods and Bayesian Optimization

Il paper introduce LAGO, un framework di ottimizzazione che integra l'ottimizzazione bayesiana globale potenziata dal gradiente con metodi di raffinamento locale basati su regioni di fiducia, selezionando dinamicamente tra le due strategie per garantire un'esplorazione efficiente dello spazio di progettazione senza compromettere la convergenza rapida nelle regioni promettenti.

Eliott Van Dieren, Tommaso Vanzan, Fabio Nobile2026-03-04🤖 cs.LG

On the Topology of Neural Network Superlevel Sets

Il lavoro dimostra che le reti neurali con attivazioni che soddisfano una condizione di tipo equazione differenziale di Riccati producono output Pfaffiani, garantendo che i loro insiemi di superlivello e i luoghi di caduta del rango delle parentesi di Lie ammettano limiti sulla complessità topologica dipendenti esclusivamente dall'architettura e uniformi rispetto ai pesi.

Bahman Gharesifard2026-03-04🤖 cs.LG

Variance reduction in lattice QCD observables via normalizing flows

Questo lavoro dimostra che l'uso dei flussi normalizzanti nella cromodinamica quantistica su reticolo permette di ottenere stimatori non distorti con una riduzione della varianza fino a 60 volte per osservabili gluonici, mantenendo tale efficienza indipendentemente dal volume del reticolo e consentendo così di minimizzare i costi computazionali di addestramento.

Ryan Abbott, Denis Boyda, Yang Fu + 5 more2026-03-04⚛️ hep-lat

Why Does RLAIF Work At All?

Questo articolo propone l'ipotesi del valore latente, sostenendo che l'RLAIF funziona perché i prompt costituzionali attivano direzioni di valore umano già codificate nello spazio delle rappresentazioni del modello durante il preaddestramento, spiegando così i limiti e i meccanismi di allineamento osservati empiricamente.

Robin Young2026-03-04🤖 cs.AI

Breaking the Prototype Bias Loop: Confidence-Aware Federated Contrastive Learning for Highly Imbalanced Clients

Il paper propone CAFedCL, un nuovo framework di apprendimento contrastivo federato che rompe il ciclo di bias dei prototipi causato dallo squilibrio delle classi attraverso un'aggregazione basata sulla fiducia, l'aumento generativo e la regolarizzazione geometrica, garantendo così migliori prestazioni e equità rispetto alle soluzioni esistenti.

Tian-Shuang Wu, Shen-Huan Lyu, Ning Chen + 4 more2026-03-04🤖 cs.LG

SEHFS: Structural Entropy-Guided High-Order Correlation Learning for Multi-View Multi-Label Feature Selection

Il paper propone SEHFS, un nuovo metodo per la selezione delle caratteristiche nell'apprendimento multi-vista multi-etichetta che utilizza l'entropia strutturale per modellare correlazioni di ordine superiore e un framework ibrido teoria dell'informazione-matrici per superare i limiti degli ottimi locali e migliorare le prestazioni.

Cheng Peng, Yonghao Li, Wanfu Gao + 2 more2026-03-04🤖 cs.LG

Step-Level Sparse Autoencoder for Reasoning Process Interpretation

Questo lavoro propone un Autoencoder Sparsamente Attivato a Livello di Passo (SSAE) che, superando i limiti degli approcci basati sui token, disgiunge le informazioni incrementali dai passaggi di ragionamento dei LLM per estrarre caratteristiche interpretabili che rivelano la capacità del modello di prevedere la correttezza e la logica dei propri ragionamenti.

Xuan Yang, Jiayu Liu, Yuhang Lai + 3 more2026-03-04🤖 cs.LG

Generalized Bayes for Causal Inference

Questo articolo propone un quadro bayesiano generalizzato per l'inferenza causale che, evitando la modellazione esplicita della verosimiglianza e aggiornando direttamente le stime degli effetti causali tramite funzioni di perdita, trasforma gli stimatori esistenti in strumenti dotati di una completa quantificazione dell'incertezza, garantendo al contempo robustezza agli errori di stima delle variabili di disturbo e validità frequentista.

Emil Javurek, Dennis Frauen, Yuxin Wang + 1 more2026-03-04📊 stat

cPNN: Continuous Progressive Neural Networks for Evolving Streaming Time Series

Il paper propone cPNN, una rete neurale progressiva continua basata su RNN che risolve congiuntamente il problema della deriva concettuale e delle dipendenze temporali nei flussi di dati in evoluzione, prevenendo al contempo la dimenticanza catastrofica.

Federico Giannini, Giacomo Ziffer, Emanuele Della Valle2026-03-04🤖 cs.AI

Reinforcement Learning with Symbolic Reward Machines

Il paper propone le Symbolic Reward Machines (SRM) e i relativi algoritmi di apprendimento QSRM e LSRM per superare i limiti delle Reward Machine tradizionali, consentendo l'elaborazione diretta delle osservazioni ambientali tramite formule simboliche senza richiedere etichette manuali, mantenendo al contempo prestazioni superiori rispetto ai metodi RL di base e paragonabili a quelle delle RM esistenti.

Thomas Krug, Daniel Neider2026-03-04🤖 cs.AI

Safe and Robust Domains of Attraction for Discrete-Time Systems: A Set-Based Characterization and Certifiable Neural Network Estimation

Questo articolo propone un nuovo quadro teorico e computazionale basato su funzioni di valore definite su spazi metrici e reti neurali fisicamente informate, per la caratterizzazione precisa e la stima certificabile dei domini di attrazione sicuri e robusti per sistemi non lineari discreti incerti soggetti a vincoli di stato.

Mohamed Serry, Maxwell Fitzsimmons, Jun Liu2026-03-04⚡ eess

On the Expressive Power of Transformers for Maxout Networks and Continuous Piecewise Linear Functions

Questo articolo dimostra che le reti Transformer possiedono un potere espressivo universale paragonabile alle reti maxout e ReLU, caratterizzando la loro capacità di approssimare funzioni lineari a tratti continue attraverso un numero di regioni lineari che cresce esponenzialmente con la profondità, grazie al fatto che i meccanismi di self-attention implementano operazioni di tipo max e i livelli feedforward realizzano trasformazioni affini.

Linyan Gu, Lihua Yang, Feng Zhou2026-03-04🤖 cs.AI

Multi-Scale Adaptive Neighborhood Awareness Transformer For Graph Fraud Detection

Il paper propone MANDATE, un trasformatore multi-scala che migliora il rilevamento delle frodi nei grafi mitigando i limiti induttivi delle GNN attraverso codifiche posizionali, strategie di embedding differenziate per omofilia/eterofilia e fusione per grafi multi-relazionali.

Jiaqi Lv, Qingfeng Du, Yu Zhang + 2 more2026-03-04🤖 cs.AI

From Complex Dynamics to DynFormer: Rethinking Transformers for PDEs

Il paper presenta DynFormer, un operatore neurale innovativo che supera i limiti degli attuali Transformer applicati alle equazioni differenziali parziali integrando principi di dinamica complessa per separare le scale fisiche, riducendo drasticamente sia l'errore relativo che il consumo di memoria GPU attraverso meccanismi di attenzione strutturata e mixing frequenza locale-globale.

Pengyu Lai, Yixiao Chen, Dewu Yang + 3 more2026-03-04🌀 nlin

Joint Training Across Multiple Activation Sparsity Regimes

Questo studio propone una strategia di addestramento che cicla un singolo modello attraverso diversi regimi di sparsità delle attivazioni, dimostrando che tale approccio migliora la generalizzazione rispetto all'addestramento denso standard su CIFAR-10.

Haotian Wang2026-03-04🤖 cs.AI

Torus embeddings

Questo articolo dimostra che è possibile adattare i framework di deep learning per creare embedding con topologia toroidale intrinseca, offrendo un'alternativa stabile e performante agli embedding ipersferici che facilita l'implementazione efficiente su dispositivi embedded (TinyML) grazie alla loro rappresentazione naturale in interi con overflow.

Dan Stowell2026-03-04🤖 cs.LG

Channel-Adaptive Edge AI: Maximizing Inference Throughput by Adapting Computational Complexity to Channel States

Questo lavoro propone un modello analitico per l'accuratezza dell'inferenza end-to-end e un algoritmo di intelligenza artificiale adattiva al canale che massimizza il throughput di elaborazione ai bordi, adattando dinamicamente la compressione delle feature e la complessità del modello in base alle condizioni del canale.

Jierui Zhang, Jianhao Huang, Kaibin Huang2026-03-04🤖 cs.AI

Less Noise, Same Certificate: Retain Sensitivity for Unlearning

Questo articolo propone un approccio all'eliminazione certificata del machine learning che, sfruttando la definizione di "sensibilità di ritenzione" invece di quella globale basata sulla privacy differenziale, riduce il rumore necessario mantenendo inalterata la garanzia di eliminazione e migliorando l'utilità del modello.

Carolin Heinzler, Kasra Malihi, Amartya Sanyal2026-03-04🤖 cs.LG

Scalable Uncertainty Quantification for Black-Box Density-Based Clustering

Il paper presenta un nuovo framework scalabile per la quantificazione dell'incertezza nel clustering basato sulla densità, che combina il paradigma del posterior martingala con stimatori neurali di densità per propagare l'incertezza nella struttura dei cluster, garantendo consistenza frequentista e scalabilità su dati ad alta dimensionalità.

Nicola Bariletto, Stephen G. Walker2026-03-04📊 stat

← Precedente Successivo →