Safety Mirage: How Spurious Correlations Undermine VLM Safety Fine-Tuning and Can Be Mitigated by Machine Unlearning

Il paper rivela come il fine-tuning supervisionato per la sicurezza dei modelli visione-linguaggio crei un "miraggio di sicurezza" basato su correlazioni spurie che possono essere aggirate o causano rifiuti eccessivi, dimostrando che l'apprendimento non supervisionato (machine unlearning) è una soluzione più efficace per rimuovere le conoscenze dannose preservando le capacità generali del modello.

Yiwei Chen, Yuguang Yao, Yihua Zhang + 3 more2026-03-06💻 cs

Differentially Private and Scalable Estimation of the Network Principal Component

Il paper propone un nuovo framework Differentially Private basato su Propose-Test-Release che, garantendo la privacy per tutti i dataset, offre un'estimazione scalabile e ad alta accuratezza della componente principale di grafi reali, superando i limiti di complessità e precisione degli algoritmi esistenti e abilitando per la prima volta la risoluzione privata del problema del Densest-k-subgraph.

Alireza Khayatian, Anil Vullikanti, Aritra Konar2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

Il paper presenta ShIOEnv, un ambiente Bash basato su Gymnasium che, sfruttando la sintesi vincolata alla grammatica e un segnale di irreducibilità auto-supervisionato, genera un dataset di 2,1 milioni di coppie input-output per migliorare l'accuratezza dei modelli nel prevedere il comportamento di esecuzione dei comandi rispetto alle basi di riferimento senza esecuzione.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

Il paper presenta VTool-R1, un framework pionieristico che addestra i modelli visione-linguaggio a generare catene di pensiero multimodali intercalando testo e passaggi visivi intermedi tramite l'uso strategico di strumenti di editing grafico e apprendimento per rinforzo, migliorando così le capacità di ragionamento su dati strutturati come grafici e tabelle.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

Highly Efficient and Effective LLMs with Multi-Boolean Architectures

Il documento propone un nuovo framework che rappresenta i modelli linguistici su larga scala con parametri booleani multi-nucleo, permettendo per la prima volta un adattamento diretto nel dominio booleano senza pesi latenti a precisione intera, ottenendo così una maggiore capacità rappresentativa e una drastica riduzione della complessità rispetto alle tecniche di quantizzazione esistenti.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs