cs.LG articoli | Gist.Science

Relatively Smart: A New Approach for Instance-Optimal Learning

Questo lavoro introduce il framework di "relatively smart learning", che supera le limitazioni dell'apprendimento PAC intelligente tradizionale richiedendo ai learner supervisionati di competere solo con le migliori garanzie semi-supervisionate "certificabili", dimostrando così che tale rilassamento permette di aggirare i risultati di impossibilità precedenti.

Shaddin Dughmi, Alireza F. Pour2026-03-03📊 stat

UTICA: Multi-Objective Self-Distllation Foundation Model Pretraining for Time Series Classification

Il paper presenta UTICA, un modello fondazionale per la classificazione delle serie temporali basato su auto-distillazione multi-obiettivo in stile DINOv2, che combina invarianza temporale e struttura locale per raggiungere prestazioni all'avanguardia sui benchmark UCR e UEA.

Yessin Moakher, Youssef Attia El Hili, Vasilii Feofanov2026-03-03🤖 cs.LG

Constructing Synthetic Instruction Datasets for Improving Reasoning in Domain-Specific LLMs: A Case Study in the Japanese Financial Domain

Questo studio presenta un metodo generale per costruire dataset di istruzioni sintetiche di alta qualità partendo dal vocabolario specifico di un settore, dimostrando nel dominio finanziario giapponese come l'uso di tracce di ragionamento (Chain-of-Thought) su larga scala migliori le capacità di ragionamento dei modelli linguistici, con risorse ora open-source.

Yuma Okochi, Fabio Milentiansen Sim, Tomoyasu Okada2026-03-03💬 cs.CL

Fed-GAME: Personalized Federated Learning with Graph Attention Mixture-of-Experts For Time-Series Forecasting

Il paper propone Fed-GAME, un framework di apprendimento federato personalizzato che utilizza un grafo implicito dinamico e un aggregatore Mixture-of-Experts con attenzione grafica per migliorare le previsioni delle serie temporali in ambienti eterogenei, superando i limiti delle topologie statiche.

Yi Li, Han Liu, Mingfeng Fan + 3 more2026-03-03🤖 cs.LG

Align and Filter: Improving Performance in Asynchronous On-Policy RL

Il paper propone il metodo TACPO, basato su vincoli di ottimizzazione della politica allineati al vantaggio tramite variazione totale, per mitigare il ritardo della politica (policy lag) nei sistemi di apprendimento per rinforzo on-policy distribuiti e ad alta frequenza di aggiornamento, migliorando così le prestazioni sia in compiti classici che nel ragionamento matematico con LLM.

Homayoun Honari, Roger Creus Castanyer, Michael Przystupa + 3 more2026-03-03⚡ eess

Causal Neural Probabilistic Circuits

Il paper propone il Causal Neural Probabilistic Circuit (CNPC), un modello che integra predittori neurali con circuiti probabilistici causali per migliorare l'interpretabilità e l'accuratezza dei Concept Bottleneck Models gestendo correttamente le dipendenze causali durante le interventi, superando così i limiti dei metodi tradizionali che ignorano tali relazioni.

Weixin Chen, Han Zhao2026-03-03🤖 cs.LG

Words & Weights: Streamlining Multi-Turn Interactions via Co-Adaptation

Il paper presenta ROSA2, un framework che migliora l'adattamento delle LLM durante l'inferenza in interazioni multi-turno ottimizzando sinergicamente sia le istruzioni testuali che i pesi del modello, riducendo così significativamente gli errori e il numero di turni necessari rispetto agli approcci esistenti.

Chenxing Wei, Hong Wang, Ying He + 4 more2026-03-03🤖 cs.LG

3BASiL: An Algorithmic Framework for Sparse plus Low-Rank Compression of LLMs

Il paper introduce 3BASiL-TM, un metodo efficiente per la compressione one-shot dei Large Language Models basato su una decomposizione in somma di matrici sparse e a basso rango che, grazie a un nuovo algoritmo ADMM a tre blocchi e a un raffinamento di matching dei transformer, riduce significativamente il gap di prestazioni rispetto ai modelli densi e accelera i tempi di compressione rispetto agli stati dell'arte.

Mehdi Makni, Xiang Meng, Rahul Mazumder2026-03-03📊 stat

Invariant-Stratified Propagation for Expressive Graph Neural Networks

Il paper introduce l'Invariant-Stratified Propagation (ISP), un nuovo framework che supera i limiti espressivi delle tradizionali GNN stratificando i nodi in base a invarianti grafici, permettendo così di distinguere posizioni strutturali complesse con un'efficienza computazionale superiore rispetto ai metodi esistenti.

Asela Hevapathige, Ahad N. Zehmakan, Asiri Wijesinghe + 1 more2026-03-03📊 stat

Quasar: Quantized Self-Speculative Acceleration for Rapid Inference via Memory-Efficient Verification

Il paper introduce Quasar, un framework di accelerazione speculativa senza addestramento che utilizza la quantizzazione a basso bit nella fase di verifica per superare il collo di bottiglia della larghezza di banda della memoria, raddoppiando il traffico di memoria e migliorando il throughput end-to-end di 1,28 volte mantenendo un'accuratezza elevata.

Guang Huang, Zeyi Wen2026-03-03🤖 cs.LG

MIST-RL: Mutation-based Incremental Suite Testing via Reinforcement Learning

Il paper presenta MIST-RL, un framework basato sul reinforcement learning che ottimizza la generazione di test unitari tramite mutazioni incrementali, superando i limiti degli approcci basati sulla quantità per ottenere suite di test più compatte ed efficaci che migliorano sia il rilevamento dei difetti che la precisione nella riclassificazione del codice.

Sicheng Zhu, Jiajun Wang, Jiawei Ai + 1 more2026-03-03🤖 cs.LG

Tackling multiphysics problems via finite element-guided physics-informed operator learning

Questo lavoro presenta un framework di apprendimento di operatori informato dalla fisica e guidato dagli elementi finiti, implementato su Folax, che risolve con alta accuratezza problemi multifisici accoppiati su domini arbitrari senza dati etichettati, dimostrando l'efficacia di diverse architetture neurali come FNO e iFOL per la previsione indipendente dalla discretizzazione in scenari complessi.

Yusuke Yamazaki, Reza Najian Asl, Markus Apel + 2 more2026-03-03🤖 cs.LG

On the Stability Connection Between Discrete-Time Algorithms and Their Resolution ODEs: Applications to Min-Max Optimisation

Questo lavoro stabilisce un rigoroso legame tra la stabilità esponenziale degli algoritmi di ottimizzazione discreta e quella delle loro corrispondenti equazioni differenziali ordinarie di risoluzione, applicando tale quadro teorico per dimostrare la stabilità di punti di equilibrio in diversi metodi di ottimizzazione min-max, tra cui GEG e TT-PPM, senza richiedere l'assunzione di invarianza dell'Hessiano.

Amir Ali Farzin, Yuen-Man Pun, Philipp Braun + 1 more2026-03-03⚡ eess

Autoregressive Synthesis of Sparse and Semi-Structured Mixed-Type Data

Il paper presenta Origami, un'architettura autoregressiva basata su transformer che genera nativamente dati sintetici di alta qualità per formati semi-strutturati e sparsi come JSON, superando i limiti dei metodi esistenti che richiedono l'appiattimento dei dati.

Thomas Rückstieß, Robin Vujanic2026-03-03🤖 cs.LG

SEAnet: A Deep Learning Architecture for Data Series Similarity Search

Il paper propone SEAnet, una nuova architettura di deep learning basata sulla tecnica di approssimazione per embedding profondo (DEA) e su strategie di campionamento innovative, che supera i limiti degli indici SAX esistenti offrendo risultati superiori nella ricerca di similarità per serie temporali massive e rumorose.

Qitong Wang, Themis Palpanas2026-03-03🤖 cs.LG

PhysFormer: A Physics-Embedded Generative Model for Physically Self-Consistent Spectral Synthesis

Il paper presenta PhysFormer, un modello generativo che integra direttamente i processi fisici nella sua architettura per garantire coerenza fisica e stabilità numerica nella sintesi spettrale di sistemi complessi, superando i limiti delle reti neurali informate dalla fisica tradizionali.

Siqi Wang, Mengmeng Zhang, Yude Bu + 1 more2026-03-03🔭 astro-ph

Reconstructing Content via Collaborative Attention to Improve Multimodal Embedding Quality

Il paper propone CoCoA, un nuovo paradigma di pre-addestramento basato sulla ricostruzione del contenuto tramite attenzione collaborativa che supera i limiti delle architetture MLLM tradizionali per generare rappresentazioni multimodali più compatte e informative, migliorando significativamente le prestazioni nei compiti di embedding.

Jiahan Chen, Da Li, Hengran Zhang + 6 more2026-03-03🤖 cs.LG

A SUPERB-Style Benchmark of Self-Supervised Speech Models for Audio Deepfake Detection

Questo lavoro introduce Spoof-SUPERB, un benchmark che valuta sistematicamente 20 modelli di apprendimento auto-supervisionato per la rilevazione di deepfake audio, rivelando che i grandi modelli discriminativi pre-addestrati multilingue offrono le prestazioni e la robustezza migliori rispetto agli approcci generativi.

Hashim Ali, Nithin Sai Adupa, Surya Subramani + 1 more2026-03-03⚡ eess

Inference-Time Safety For Code LLMs Via Retrieval-Augmented Revision

Il paper presenta un meccanismo di sicurezza a tempo di inferenza per i modelli linguistici di codice che, sfruttando la generazione aumentata dal recupero di discussioni di sicurezza da Stack Overflow, revisiona il codice generato per migliorarne la trasparenza, la robustezza e l'allineamento alla sicurezza senza necessità di riaddestramento.

Manisha Mukherjee, Vincent J. Hellendoorn2026-03-03🤖 cs.AI

Training Dynamics of Softmax Self-Attention: Fast Global Convergence via Preconditioning

Questo studio dimostra che un algoritmo di discesa del gradiente di primo ordine, arricchito da un inizializzazione spettrale dipendente dai dati e da un precondizionatore strutturale, converge geometricamente alla soluzione globale ottimale per un layer di auto-attenzione softmax addestrato su regressione lineare.

Gautam Goel, Mahdi Soltanolkotabi, Peter Bartlett2026-03-03📊 stat

← Precedente Successivo →