cs.LG articoli | Gist.Science

PatchDecomp: Interpretable Patch-Based Time Series Forecasting

PatchDecomp è un metodo di previsione delle serie temporali basato su reti neurali che combina alta accuratezza e interpretabilità suddividendo i dati in patch e aggregando i contributi di ciascuna per generare previsioni spiegabili.

Hiroki Tomioka, Genta Yoshimura2026-03-05🤖 cs.AI

From Misclassifications to Outliers: Joint Reliability Assessment in Classification

Questo lavoro propone un nuovo framework di valutazione unificato e il metodo SURE+ per migliorare l'affidabilità dei classificatori valutando congiuntamente la rilevazione di dati fuori distribuzione e la previsione degli errori, superando i limiti degli approcci tradizionali.

Yang Li, Youyang Sha, Yinzhi Wang + 4 more2026-03-05🤖 cs.LG

BD-Merging: Bias-Aware Dynamic Model Merging with Evidence-Guided Contrastive Learning

Il paper presenta BD-Merging, un framework di fusione di modelli non supervisionato e consapevole dei bias che, integrando una testa evidenziale per la modellazione dell'incertezza, un punteggio di discrepanza di adiacenza e un apprendimento contrastivo, migliora l'affidabilità e la robustezza dei modelli fusi in presenza di spostamenti della distribuzione dei dati durante il test.

Yuhan Xie, Chen Lyu2026-03-05🤖 cs.AI

Hierarchical Inference and Closure Learning via Adaptive Surrogates for ODEs and PDEs

Questo articolo presenta un metodo gerarchico bayesiano che combina inferenza parametrica e modelli di chiusura basati su machine learning per risolvere problemi inversi in ODE e PDE, utilizzando algoritmi di campionamento avanzati e un'ottimizzazione bilevel per addestrare simultaneamente surrogate efficienti come FNO e PINN.

Pengyu Zhang, Arnaud Vadeboncoeur, Alex Glyn-Davies + 1 more2026-03-05🤖 cs.LG

Selecting Offline Reinforcement Learning Algorithms for Stochastic Network Control

Lo studio valuta diverse tecniche di apprendimento per rinforzo offline in un ambiente telecomunicazioni stocastico, dimostrando che il Conservative Q-Learning offre la maggiore robustezza e rappresenta la scelta predefinita più affidabile per la gestione dei reti future, sebbene i metodi basati su sequenze possano risultare competitivi in presenza di dati ad alto rendimento.

Nicolas Helson, Pegah Alizadeh, Anastasios Giovanidis2026-03-05🤖 cs.AI

How Predicted Links Influence Network Evolution: Disentangling Choice and Algorithmic Feedback in Dynamic Graphs

Il paper propone un quadro temporale basato su processi di Hawkes multivariati per distinguere le tendenze intrinseche di interazione dagli effetti di amplificazione algoritmica nelle reti dinamiche, introducendo una misura di bias istantaneo che cattura le dinamiche di rinforzo in tempo reale e dimostrandone l'affidabilità nel riflettere gli effetti del feedback algoritmico.

Mathilde Perez, Raphaël Romero, Jefrey Lijffijt + 1 more2026-03-05🤖 cs.LG

Lang2Str: Two-Stage Crystal Structure Generation with LLMs and Continuous Flow Models

Il paper presenta Lang2Str, un framework generativo a due stadi che combina grandi modelli linguistici e flussi continui per produrre strutture cristalline valide e diversificate con maggiore precisione rispetto agli stati dell'arte.

Cong Liu, Chengyue Gong, Zhenyu Liu + 2 more2026-03-05🤖 cs.LG

GIPO: Gaussian Importance Sampling Policy Optimization

Il paper presenta GIPO, un nuovo metodo di ottimizzazione della politica basato su campionamento per importanza gaussiano che, sostituendo il clipping rigido con un peso di fiducia logaritmico, migliora l'efficienza dei campioni e la stabilità dell'addestramento per agenti multimodali in scenari con dati di interazione limitati o obsoleti.

Chengxuan Lu, Zhenquan Zhang, Shukuan Wang + 3 more2026-03-05🤖 cs.AI

TFWaveFormer: Temporal-Frequency Collaborative Multi-level Wavelet Transformer for Dynamic Link Prediction

Il paper presenta TFWaveFormer, un'architettura Transformer innovativa che integra l'analisi temporale-frequenziale con una decomposizione wavelet multi-risoluzione adattiva per migliorare significativamente le prestazioni nella previsione di link dinamici.

Hantong Feng, Yonggang Wu, Duxin Chen + 1 more2026-03-05🤖 cs.AI

Upholding Epistemic Agency: A Brouwerian Assertibility Constraint for Responsible AI

Il paper propone un vincolo di assertibilità ispirato a Brouwer per l'IA responsabile, che in contesti ad alto rischio obbliga i sistemi a restituire "Indeterminato" se non possono fornire un certificato pubblico e contestabile di legittimità, preservando così l'agenzia epistemica umana attraverso un'interfaccia a tre stati che separa l'entitlement interno dalla posizione pubblica.

Michael Jülich2026-03-05🤖 cs.AI

Dual-Solver: A Generalized ODE Solver for Diffusion Models with Dual Prediction

Il paper presenta Dual-Solver, un solutore ODE generalizzato per modelli di diffusione che, mediante parametri appresi per interpolare dinamicamente tra tipi di previsione, domini di integrazione e termini residui, migliora significativamente la qualità del campionamento a basso costo computazionale (3-9 valutazioni della funzione) rispetto ai metodi tradizionali.

Soochul Park, Yeon Ju Lee2026-03-05🤖 cs.LG

Specialization of softmax attention heads: insights from the high-dimensional single-location model

Questo lavoro propone un modello teorico che spiega la specializzazione sequenziale delle teste di attenzione nei transformer, dimostrando come l'uso di funzioni di attivazione specifiche, come softmax-1 e Bayes-softmax, riduca il rumore e ottimizzi le prestazioni predittive.

M. Sagitova, O. Duranthon, L. Zdeborová2026-03-05🤖 cs.LG

Spectral Surgery: Training-Free Refinement of LoRA via Gradient-Guided Singular Value Reweighting

Il paper propone "Spectral Surgery", un metodo senza addestramento che migliora gli adattatori LoRA già esistenti riaggiustando i valori singolari tramite una reweighting guidata dal gradiente, ottenendo guadagni significativi su diversi benchmark senza modificare le direzioni apprese.

Zailong Tian, Yanzhe Chen, Zhuoheng Han + 1 more2026-03-05🤖 cs.AI

On the Learnability of Offline Model-Based Optimization: A Ranking Perspective

Questo lavoro sfida l'assunzione tradizionale che la precisione predittiva sia fondamentale per l'ottimizzazione basata su modelli offline, proponendo invece una prospettiva basata sul ranking che identifica lo spostamento distribuzionale come errore dominante e introduce un metodo di ranking consapevole della distribuzione che supera ventisette metodi esistenti, pur rivelando limiti intrinseci nell'evitare l'estrapolazione eccessivamente ottimistica.

Shen-Huan Lyu, Rong-Xi Tan, Ke Xue + 4 more2026-03-05🤖 cs.LG

Training-Free Rate-Distortion-Perception Traversal With Diffusion

Questo lavoro propone un framework senza addestramento che, sfruttando modelli di diffusione pre-addestrati e un modulo di codifica del canale inverso, permette di navigare l'intera superficie del compromesso tra velocità, distorsione e percezione (RDP) senza necessità di riaddestramento, offrendo una soluzione sia teoricamente fondata che empiricamente efficace per la compressione adattiva.

Yuhan Wang, Suzhi Bi, Ying-Jun Angela Zhang2026-03-05🤖 cs.LG

Fixed-Budget Constrained Best Arm Identification in Grouped Bandits

Il documento presenta un limite inferiore per l'errore e propone l'algoritmo FCSR per l'identificazione dell'arma migliore in un contesto di banditi raggruppati con vincoli di fattibilità, dimostrando la sua ottimalità teorica e le superiori prestazioni empiriche.

Raunak Mukherjee, Sharayu Moharir2026-03-05🤖 cs.LG

Continuous Modal Logical Neural Networks: Modal Reasoning via Stochastic Accessibility

Il paper propone "Fluid Logic", un paradigma che trasforma il ragionamento modale da strutture discrete a varietà continue tramite Equazioni Differenziali Stocastiche Neurali, permettendo alle Reti Neurali Logiche Continue (CMLNNs) di garantire coerenza strutturale con proprietà logiche complesse in ambiti come la logica epistemica, temporale e deontica.

Antonin Sulc2026-03-05🤖 cs.LG

A Multi-Dimensional Quality Scoring Framework for Decentralized LLM Inference with Proof of Quality

Questo articolo propone un framework di scoring della qualità multidimensionale per l'inferenza decentralizzata di LLM, che, attraverso l'audit e la calibrazione delle sue componenti, genera un segnale di qualità affidabile e competitivo per meccanismi di Proof of Quality in ambienti avversariali.

Arther Tian, Alex Ding, Frank Chen + 2 more2026-03-05🤖 cs.AI

Multi-Stage Music Source Restoration with BandSplit-RoFormer Separation and HiFi++ GAN

Il rapporto tecnico presenta il sistema del team CP-JKU per la sfida MSR ICASSP 2025, che combina un separatore BandSplit-RoFormer addestrato con un curriculum a tre stadi e un restorer HiFi++ GAN specializzato per il recupero di stem strumentali originali da audio mixati e masterizzati.

Tobias Morocutti, Emmanouil Karystinaios, Jonathan Greif + 1 more2026-03-05🤖 cs.LG

DQE-CIR: Distinctive Query Embeddings through Learnable Attribute Weights and Target Relative Negative Sampling in Composed Image Retrieval

Il paper propone DQE-CIR, un metodo per il recupero di immagini composte che migliora la discriminatività delle query attraverso pesi attributivi apprendibili e un campionamento negativo relativo al target, superando i limiti dei framework contrastivi tradizionali.

Geon Park, Ji-Hoon Park, Seong-Whan Lee2026-03-05🤖 cs.AI

← Precedente Successivo →