cs.LG articoli | Gist.Science

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

Il paper propone un metodo di propagazione dei limiti lineari che calcola con precisione i vincoli sull'inviluppo convesso degli attacchi $\ell_0$ , migliorando significativamente l'efficienza e la precisione della certificazione della robustezza rispetto agli approcci esistenti.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Questo lavoro propone un nuovo metodo di attacco avversario per le reti iperboliche, denominato "Angular Gradient Sign", che sfrutta le proprietà geometriche dello spazio iperbolico applicando perturbazioni esclusivamente nella direzione angolare per ottenere tassi di inganno superiori rispetto alle tecniche tradizionali.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Questo lavoro introduce un quadro probabilistico realistico basato sulla nozione di "(k, ε)-instabile" per fornire garanzie di sicurezza più affidabili e pratiche contro gli attacchi di jailbreaking, superando le limitazioni dell'assunzione "k-instabile" rigida del metodo di difesa SmoothLLM.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Questo articolo presenta una pipeline automatizzata per generare dataset su larga scala di jailbreak conversazionali basati sul principio psicologico del "piede nella porta", rivelando attraverso un benchmark di 1.500 scenari che la robustezza dei modelli LLM varia drasticamente, con la famiglia GPT particolarmente vulnerabile al contesto conversazionale mentre Gemini 2.5 Flash dimostra un'eccezionale resilienza.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Il paper propone un metodo di regolarizzazione nello spazio latente che, identificando gli assi correlati alle scorciatoie in uno spazio disaccoppiato e iniettando rumore anisotropo mirato, impone un'invarianza funzionale per migliorare la generalizzazione fuori distribuzione senza richiedere etichette di scorciatoia o esempi conflittuali.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Questo studio dimostra che la soluzione di problemi offline tramite un concorso Kaggle ha permesso di sviluppare parametrizzazioni ibride fisica-ML stabili e all'avanguardia per le simulazioni climatiche, superando le tradizionali sfide di instabilità online.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

Il paper introduce CRAwDAD, un framework di dibattito tra due agenti che migliora significativamente l'accuratezza del ragionamento causale nei modelli linguistici avanzati, come dimostrato dai risultati sul dataset CLadder.

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Questo studio presenta ForamDeepSlice, un framework di deep learning ad alta precisione che utilizza un ensemble di reti neurali convoluzionali per classificare automaticamente le specie di foraminiferi da fette 2D micro-CT, raggiungendo un'accuratezza del 95,64% e fornendo una dashboard interattiva per l'identificazione micropaleontologica assistita dall'IA.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

Il paper introduce AltNet, un metodo basato su reti gemelle che risolve il dilemma plasticità-stabilità nell'apprendimento per rinforzo ripristinando la capacità di apprendimento tramite reset periodici senza causare cali temporanei delle prestazioni, garantendo così maggiore efficienza e sicurezza in ambienti critici.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

Il paper introduce MSPT, un'architettura Transformer multi-scala che combina l'attenzione locale e globale per simulare efficientemente fenomeni fisici su larga scala con milioni di elementi su una singola GPU, ottenendo prestazioni all'avanguardia con un ridotto consumo di risorse.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual Randomized Smoothing: Beyond Global Noise Variance

Il paper propone il "Dual Randomized Smoothing", un nuovo framework che supera i limiti della varianza di rumore globale utilizzando una varianza dipendente dall'input per ottenere prestazioni certificate robuste sia a piccoli che a grandi raggi, superando significativamente i metodi precedenti su CIFAR-10 e ImageNet.

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

Il paper presenta DROCO, un nuovo algoritmo di apprendimento per rinforzo offline cross-domain che garantisce robustezza sia durante l'addestramento che al test, affrontando gli spostamenti dinamici attraverso un innovativo operatore di Bellman robusto e tecniche di penalizzazione del valore.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

Il paper presenta GoRL, un framework che risolve il compromesso tra stabilità di ottimizzazione e capacità rappresentativa nell'apprendimento per rinforzo online, decoupling l'ottimizzazione della politica da uno spazio latente trattabile e la generazione delle azioni in uno spazio espressivo, ottenendo prestazioni superiori su compiti di controllo continuo.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Il documento presenta la Sparse Isotonic Shapley Regression (SISR), un nuovo framework unificato per l'IA spiegabile che supera i limiti dell'additività e della densità dei valori Shapley tradizionali, apprendendo simultaneamente una trasformazione monotona non lineare e imponendo vincoli di sparsità per fornire attribuzioni robuste, efficienti e teoricamente fondate in scenari complessi.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Questo lavoro propone un framework di augmentation dati a due fasi che combina warping basato su regole e traduzione immagine-immagine tramite GAN per generare volti con mascherine realistici, ottenendo miglioramenti significativi nella rilevazione e riconoscimento anche con un set di addestramento molto ridotto rispetto ai metodi esistenti.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

Il paper presenta SALVE, un quadro unificato che combina autoencoder sparsi e mappatura di salienza per scoprire, validare e controllare meccanicisticamente il comportamento delle reti neurali attraverso interventi precisi nello spazio dei pesi, garantendo sistemi di AI più trasparenti e controllabili.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

Il paper presenta LaMer, un framework Meta-RL che permette agli agenti LLM di esplorare attivamente e adattarsi in tempo reale tramite riflessione, migliorando significativamente le prestazioni e la generalizzazione su compiti complessi rispetto alle tradizionali tecniche di apprendimento per rinforzo.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

Il paper introduce Re-Depth Anything, un framework di auto-supervisione a test-time che migliora l'estimazione della profondità monoculari fondendo modelli fondazionali con prior di diffusione su larga scala per affinare le mappe di profondità tramite ricreazione dell'illuminazione e Score Distillation Sampling, ottenendo risultati all'avanguardia senza richiedere etichette.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Questo articolo propone tre strategie complementari per accelerare l'addestramento delle reti Kolmogorov-Arnold (KAN) basate sul metodo Newton-Kaczmarz: un pre-addestramento strutturato, l'addestramento su sottoinsiemi di dati disgiunti con successiva fusione dei modelli e una tecnica di parallelizzazione implementata e testata su FPGA.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

Il paper propone "Latent Sculpting", un approccio di apprendimento gerarchico che combina un encoder Transformer con una perdita di scultura latente binaria e un flusso autoregressivo mascherato per modellare esplicitamente la struttura geometrica dei dati, permettendo così di rilevare con successo anomalie fuori distribuzione e attacchi zero-day nel traffico di rete senza necessità di esempi di addestramento specifici.

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

← Precedente Successivo →

cs.LG

Tight Robustness Certification Through the Convex Hull of ℓ0\ell_0ℓ0​ Attacks