Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols

Questo lavoro introduce FEWTRANS, un benchmark completo con un protocollo di valutazione rigoroso per il trasferimento few-shot, rivelando che la scelta del modello pre-addestrato è il fattore dominante e che il semplice fine-tuning completo spesso supera metodi più complessi grazie a micro-aggiustamenti distribuiti, mentre i modelli multimodali subiscono un crollo delle prestazioni in domini specializzati a causa della rarità linguistica.

Xu Luo, Ji Zhang, Lianli Gao + 2 more2026-03-03🤖 cs.LG

Analyzing Physical Adversarial Example Threats to Machine Learning in Election Systems

Questo studio quantifica il rischio di manipolazione degli esiti elettorali statunitensi tramite esempi avversariali fisici, rivelando un divario tra gli attacchi più efficaci nel dominio digitale e quelli nel dominio fisico e fornendo un quadro probabilistico per determinare il numero di schede necessarie per ribaltare un'elezione.

Khaleque Md Aashiq Kamal, Surya Eada, Aayushi Verma + 4 more2026-03-03🤖 cs.LG

Dynamic Spatio-Temporal Graph Neural Network for Early Detection of Pornography Addiction in Adolescents Based on Electroencephalogram Signals

Questo studio propone una rete neurale grafica spaziotemporale dinamica (DST-GNN) che integra segnali EEG per rilevare precocemente la dipendenza da pornografia negli adolescenti, ottenendo un miglioramento significativo delle prestazioni rispetto ai metodi convenzionali e identificando biomarcatori neurali specifici nelle regioni frontali e centrali.

Achmad Ardani Prasha, Clavino Ourizqi Rachmadi, Sabrina Laila Mutiara + 3 more2026-03-03🤖 cs.LG

ArtiFixer: Enhancing and Extending 3D Reconstruction with Auto-Regressive Diffusion Models

Il paper presenta ArtiFixer, un metodo a due stadi che utilizza un modello generativo bidirezionale addestrato con una strategia di mixing dell'opacità e successivamente distillato in un modello causale auto-regressivo per correggere gli artefatti e migliorare la ricostruzione 3D in aree non osservate, superando significativamente le prestazioni degli approcci esistenti.

Riccardo de Lutio, Tobias Fischer, Yen-Yu Chang + 7 more2026-03-03🤖 cs.LG

Antibody: Strengthening Defense Against Harmful Fine-Tuning for Large Language Models via Attenuating Harmful Gradient Influence

Il lavoro presenta "Antibody", una strategia di difesa che protegge i grandi modelli linguistici dagli attacchi di fine-tuning dannosi garantendo un allineamento di sicurezza robusto e applicando un algoritmo di apprendimento che attenua l'influenza dei gradienti dannosi durante il processo di addestramento.

Quoc Minh Nguyen, Trung Le, Jing Wu + 2 more2026-03-03🤖 cs.LG

Mathematical Foundations of Poisoning Attacks on Linear Regression over Cumulative Distribution Functions

Questo lavoro fornisce un'analisi teorica rigorosa degli attacchi di avvelenamento contro i modelli di regressione lineare sui CDF, fondamentali per gli indici appresi, dimostrando l'ottimalità dell'attacco a punto singolo, identificando i limiti dell'approccio greedy per gli attacchi multi-punto e proponendo un metodo per calcolare un limite superiore all'impatto di tali attacchi.

Atsuki Sato, Martin Aumüller, Yusuke Matsui2026-03-03🤖 cs.LG

Spectral Condition for μμP under Width-Depth Scaling

Questo lavoro introduce un quadro spettrale unificato per la parametrizzazione μ\muP che, definendo condizioni precise sulla scalatura di pesi e aggiornamenti in reti residue con profondità e larghezza variabili, offre una ricetta generale per ottimizzatori diversi e garantisce un apprendimento stabile e un trasferimento efficace degli iperparametri durante la scalatura congiunta.

Chenyu Zheng, Rongzhen Wang, Xinyu Zhang + 1 more2026-03-03📊 stat