cs.LG articoli | Gist.Science

Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols

Questo lavoro introduce FEWTRANS, un benchmark completo con un protocollo di valutazione rigoroso per il trasferimento few-shot, rivelando che la scelta del modello pre-addestrato è il fattore dominante e che il semplice fine-tuning completo spesso supera metodi più complessi grazie a micro-aggiustamenti distribuiti, mentre i modelli multimodali subiscono un crollo delle prestazioni in domini specializzati a causa della rarità linguistica.

Xu Luo, Ji Zhang, Lianli Gao + 2 more2026-03-03🤖 cs.LG

Analyzing Physical Adversarial Example Threats to Machine Learning in Election Systems

Questo studio quantifica il rischio di manipolazione degli esiti elettorali statunitensi tramite esempi avversariali fisici, rivelando un divario tra gli attacchi più efficaci nel dominio digitale e quelli nel dominio fisico e fornendo un quadro probabilistico per determinare il numero di schede necessarie per ribaltare un'elezione.

Khaleque Md Aashiq Kamal, Surya Eada, Aayushi Verma + 4 more2026-03-03🤖 cs.LG

Dynamic Spatio-Temporal Graph Neural Network for Early Detection of Pornography Addiction in Adolescents Based on Electroencephalogram Signals

Questo studio propone una rete neurale grafica spaziotemporale dinamica (DST-GNN) che integra segnali EEG per rilevare precocemente la dipendenza da pornografia negli adolescenti, ottenendo un miglioramento significativo delle prestazioni rispetto ai metodi convenzionali e identificando biomarcatori neurali specifici nelle regioni frontali e centrali.

Achmad Ardani Prasha, Clavino Ourizqi Rachmadi, Sabrina Laila Mutiara + 3 more2026-03-03🤖 cs.LG

Heaviside Low-Rank Support Matrix Machine

Il paper propone HL-SMM, un nuovo modello di Support Matrix Machine basato sulla funzione di perdita di Heaviside e su vincoli di basso rango, che offre maggiore robustezza al rumore e accuratezza rispetto ai metodi esistenti grazie a un algoritmo di minimizzazione alternata prossimale con soluzioni in forma chiusa.

Xianchao Xiu, Shenghao Sun, Xinrong Li + 1 more2026-03-03🤖 cs.LG

ArtiFixer: Enhancing and Extending 3D Reconstruction with Auto-Regressive Diffusion Models

Il paper presenta ArtiFixer, un metodo a due stadi che utilizza un modello generativo bidirezionale addestrato con una strategia di mixing dell'opacità e successivamente distillato in un modello causale auto-regressivo per correggere gli artefatti e migliorare la ricostruzione 3D in aree non osservate, superando significativamente le prestazioni degli approcci esistenti.

Riccardo de Lutio, Tobias Fischer, Yen-Yu Chang + 7 more2026-03-03🤖 cs.LG

A Polynomial-Time Axiomatic Alternative to SHAP for Feature Attribution

Questo articolo propone ESENSC_rev2, un metodo di attribuzione delle caratteristiche alternativo a SHAP che, fondato sulla teoria dei giochi cooperativi e caratterizzato da un insieme di assiomi, offre un'approssimazione accurata con complessità computazionale polinomiale, rendendolo ideale per scenari di alta dimensionalità.

Kazuhiro Hiraki, Shinichi Ishihara, Takumi Kongo + 1 more2026-03-03🤖 cs.LG

Antibody: Strengthening Defense Against Harmful Fine-Tuning for Large Language Models via Attenuating Harmful Gradient Influence

Il lavoro presenta "Antibody", una strategia di difesa che protegge i grandi modelli linguistici dagli attacchi di fine-tuning dannosi garantendo un allineamento di sicurezza robusto e applicando un algoritmo di apprendimento che attenua l'influenza dei gradienti dannosi durante il processo di addestramento.

Quoc Minh Nguyen, Trung Le, Jing Wu + 2 more2026-03-03🤖 cs.LG

Trinity: A Scenario-Aware Recommendation Framework for Large-Scale Cold-Start Users

Il paper presenta Trinity, un framework di raccomandazione consapevole dello scenario che risolve la sfida del cold-start per i nuovi utenti integrando ingegneria delle feature, architettura del modello e aggiornamenti stabili, dimostrando risultati significativi in un prodotto Microsoft con miliardi di utenti.

Wenhao Zheng, Wang Lu, Fangshuang Tang + 4 more2026-03-03🤖 cs.LG

Multimodal Adaptive Retrieval Augmented Generation through Internal Representation Learning

Il paper propone MMA-RAG, un sistema di generazione aumentata dal recupero multimodale che utilizza l'apprendimento delle rappresentazioni interne per adattare dinamicamente l'uso di conoscenze esterne, riducendo le allucinazioni e migliorando l'affidabilità nelle risposte ai quesiti visivi.

Ruoshuang Du, Xin Sun, Qiang Liu + 4 more2026-03-03🤖 cs.LG

FastBUS: A Fast Bayesian Framework for Unified Weakly-Supervised Learning

Il paper presenta FastBUS, un nuovo framework bayesiano unificato che risolve i limiti computazionali e di gestione delle etichette nei contesti di apprendimento debolmente supervisionato, ottenendo risultati all'avanguardia con un'accelerazione fino a centinaia di volte rispetto ai metodi esistenti.

Ziquan Wang, Haobo Wang, Ke Chen + 2 more2026-03-03🤖 cs.LG

Phys-Diff: A Physics-Inspired Latent Diffusion Model for Tropical Cyclone Forecasting

Il paper presenta Phys-Diff, un modello di diffusione latente ispirato alla fisica che migliora le previsioni dei cicloni tropicali disaccoppiando le caratteristiche latenti e integrando dati multimodali per garantire coerenza fisica e raggiungere prestazioni all'avanguardia.

Lei Liu, Xiaoning Yu, Kang Chen + 4 more2026-03-03🤖 cs.LG

CIRCUS: Circuit Consensus under Uncertainty via Stability Ensembles

Il paper presenta CIRCUS, un metodo che affronta l'incertezza nella scoperta di circuiti meccanici aggregando molteplici configurazioni di pruning per identificare un "nucleo" di consenso stabile e affidabile, riducendo drasticamente la dimensione dei circuiti senza richiedere riaddestramento.

Swapnil Parekh2026-03-03💬 cs.CL

Bridge Matching Sampler: Scalable Sampling via Generalized Fixed-Point Diffusion Matching

Il documento presenta il Bridge Matching Sampler (BMS), un metodo innovativo che generalizza le iterazioni a punto fisso per apprendere mappe di trasporto stocastiche tra distribuzioni arbitrarie, consentendo un campionamento scalabile e stabile da densità non normalizzate senza compromettere la diversità delle modalità.

Denis Blessing, Lorenz Richter, Julius Berner + 2 more2026-03-03🤖 cs.LG

Mathematical Foundations of Poisoning Attacks on Linear Regression over Cumulative Distribution Functions

Questo lavoro fornisce un'analisi teorica rigorosa degli attacchi di avvelenamento contro i modelli di regressione lineare sui CDF, fondamentali per gli indici appresi, dimostrando l'ottimalità dell'attacco a punto singolo, identificando i limiti dell'approccio greedy per gli attacchi multi-punto e proponendo un metodo per calcolare un limite superiore all'impatto di tali attacchi.

Atsuki Sato, Martin Aumüller, Yusuke Matsui2026-03-03🤖 cs.LG

Spectral Condition for $μ$ P under Width-Depth Scaling

Questo lavoro introduce un quadro spettrale unificato per la parametrizzazione $\mu$ P che, definendo condizioni precise sulla scalatura di pesi e aggiornamenti in reti residue con profondità e larghezza variabili, offre una ricetta generale per ottimizzatori diversi e garantisce un apprendimento stabile e un trasferimento efficace degli iperparametri durante la scalatura congiunta.

Chenyu Zheng, Rongzhen Wang, Xinyu Zhang + 1 more2026-03-03📊 stat

GCL-Sampler: Discovering Kernel Similarity for Sampled GPU Simulation via Graph Contrastive Learning

Il paper presenta GCL-Sampler, un framework di campionamento basato sull'apprendimento contrastivo su grafi che supera i metodi esistenti per la simulazione GPU, ottenendo un'accelerazione media di 258,94 volte con un errore minimo dello 0,37% grazie alla scoperta automatica di similarità tra kernel.

Jiaqi Wang, Jingwei Sun, Jiyu Luo + 2 more2026-03-03🤖 cs.LG

Learning to Attack: A Bandit Approach to Adversarial Context Poisoning

Il paper introduce AdvBandit, un attacco adattivo in stile bandit che, senza accedere ai parametri interni della vittima, inquina i contesti dei banditi neurali per indurre decisioni subottimali, garantendo teoricamente un rimpianto crescente per la vittima e dimostrando superiorità sperimentale su dataset reali rispetto agli stati dell'arte.

Ray Telikani, Amir H. Gandomi2026-03-03🤖 cs.LG

Enhancing Molecular Property Predictions by Learning from Bond Modelling and Interactions

Il paper presenta DeMol, un nuovo framework a doppio grafo che supera i limiti dei modelli tradizionali focalizzati sugli atomi integrando esplicitamente una prospettiva centrata sui legami per raggiungere prestazioni all'avanguardia nella previsione delle proprietà molecolari.

Yunqing Liu, Yi Zhou, Wenqi Fan2026-03-03🤖 cs.LG

TopoEdge: Topology-Grounded Agentic Framework for Edge Networking Code Generation and Repair

TopoEdge è un framework agenziale basato su topologia che genera e ripara configurazioni di reti SDN ai margini della rete, integrando un'incapsulazione grafica tramite GNN con un ciclo iterativo di generazione, verifica e riparazione coordinato da agenti specializzati per garantire affidabilità e conformità ai vincoli operativi.

Haomin Qi, Bohan Liu, Zihan Dai + 1 more2026-03-03🤖 cs.LG

DeepAFL: Deep Analytic Federated Learning

Il paper propone DeepAFL, un approccio di apprendimento federato che combina la resilienza all'eterogeneità dei dati dei metodi analitici con la capacità di apprendimento rappresentativo dei modelli profondi, superando i limiti delle soluzioni a strato singolo tramite blocchi residui privi di gradienti e un protocollo di addestramento strato per strato.

Jianheng Tang, Yajiang Huang, Kejia Fan + 8 more2026-03-03🤖 cs.LG

← Precedente Successivo →

cs.LG