Differentially Private and Scalable Estimation of the Network Principal Component

Il paper propone un nuovo framework Differentially Private basato su Propose-Test-Release che, garantendo la privacy per tutti i dataset, offre un'estimazione scalabile e ad alta accuratezza della componente principale di grafi reali, superando i limiti di complessità e precisione degli algoritmi esistenti e abilitando per la prima volta la risoluzione privata del problema del Densest-k-subgraph.

Alireza Khayatian, Anil Vullikanti, Aritra Konar2026-03-06💻 cs

ShIOEnv: A Command Evaluation Environment for Grammar-Constrained Synthesis and Execution Behavior Modeling

Il paper presenta ShIOEnv, un ambiente Bash basato su Gymnasium che, sfruttando la sintesi vincolata alla grammatica e un segnale di irreducibilità auto-supervisionato, genera un dataset di 2,1 milioni di coppie input-output per migliorare l'accuratezza dei modelli nel prevedere il comportamento di esecuzione dei comandi rispetto alle basi di riferimento senza esecuzione.

Jarrod Ragsdale, Rajendra Boppana2026-03-06💻 cs

VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use

Il paper presenta VTool-R1, un framework pionieristico che addestra i modelli visione-linguaggio a generare catene di pensiero multimodali intercalando testo e passaggi visivi intermedi tramite l'uso strategico di strumenti di editing grafico e apprendimento per rinforzo, migliorando così le capacità di ragionamento su dati strutturati come grafici e tabelle.

Mingyuan Wu, Jingcheng Yang, Jize Jiang + 6 more2026-03-06💻 cs

Highly Efficient and Effective LLMs with Multi-Boolean Architectures

Il documento propone un nuovo framework che rappresenta i modelli linguistici su larga scala con parametri booleani multi-nucleo, permettendo per la prima volta un adattamento diretto nel dominio booleano senza pesi latenti a precisione intera, ottenendo così una maggiore capacità rappresentativa e una drastica riduzione della complessità rispetto alle tecniche di quantizzazione esistenti.

Ba-Hien Tran, Van Minh Nguyen2026-03-06💻 cs

HSG-12M: A Large-Scale Benchmark of Spatial Multigraphs from the Energy Spectra of Non-Hermitian Crystals

Il paper introduce HSG-12M, un dataset su larga scala di 16,7 milioni di grafi multigrafo spaziali derivati dagli spettri energetici di cristalli non hermitiani, generato tramite il nuovo strumento automatizzato Poly2Graph per colmare il divario tra fisica della materia condensata e apprendimento automatico geometrico.

Xianquan Yan, Hakan Akgün, Kenji Kawaguchi + 2 more2026-03-06🔬 cond-mat.mes-hall

EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements

Il paper introduce EDINET-Bench, un benchmark open-source giapponese basato su dieci anni di relazioni annuali per valutare le capacità di ragionamento esperto dei modelli linguistici su compiti finanziari complessi come il rilevamento delle frodi, dimostrando che gli attuali LLM faticano a superare le prestazioni di modelli statistici semplici e sottolineando la necessità di framework di valutazione più strutturati che simulino l'ambiente professionale reale.

Issa Sugiura, Takashi Ishida, Taro Makino + 4 more2026-03-06💻 cs

Bures-Wasserstein Flow Matching for Graph Generation

Questo articolo introduce BWFlow, un framework di flow matching per la generazione di grafi che supera le limitazioni delle interpolazioni lineari tradizionali modellando l'evoluzione congiunta di nodi e archi attraverso campi casuali di Markov e il trasporto ottimo di Wasserstein, garantendo così percorsi probabilistici più lisci, una convergenza di addestramento migliorata e un campionamento efficiente.

Keyue Jiang, Jiahao Cui, Xiaowen Dong + 1 more2026-03-06💻 cs