cs.LG articoli | Gist.Science

Inducing Dyslexia in Vision Language Models

Questo studio utilizza modelli visione-linguaggio su larga scala per simulare la dislessia identificando e perturbando unità artificiali analoghe all'area della forma visiva delle parole, riproducendo così le specifiche difficoltà fonologiche e la sensibilità ai font osservate negli esseri umani affetti da dislessia.

Melika Honarmand, Ayati Sharma, Badr AlKhamissi + 2 more2026-02-27💬 cs.CL

Generative Value Conflicts Reveal LLM Priorities

Il paper introduce ConflictScope, un pipeline automatico che rivela come i grandi modelli linguistici tendano a privilegiare l'autonomia dell'utente rispetto alla sicurezza in scenari di conflitto di valori aperti, dimostrando tuttavia che l'inserimento di ordinamenti dettagliati nei prompt di sistema può migliorare significativamente l'allineamento del modello.

Andy Liu, Kshitish Ghate, Mona Diab + 3 more2026-02-27💬 cs.CL

Beyond Linear Probes: Dynamic Safety Monitoring for Language Models

Il paper introduce i Truncated Polynomial Classifiers (TPC), un metodo innovativo per il monitoraggio dinamico della sicurezza dei modelli linguistici che bilancia costi computazionali e robustezza adattando il livello di analisi in base alla difficoltà dell'input, superando i limiti dei tradizionali monitor lineari.

James Oldfield, Philip Torr, Ioannis Patras + 2 more2026-02-27🤖 cs.LG

Secure and reversible face anonymization with diffusion models

Questo articolo presenta il primo framework basato su modelli di diffusione per l'anonimizzazione facciale sicura e reversibile, che utilizza la condizionamento tramite chiave segreta per garantire il recupero esatto dell'identità solo agli utenti autorizzati mantenendo al contempo alta qualità visiva e robustezza.

Pol Labarbarie, Vincent Itier, William Puech2026-02-27🤖 cs.LG

Atlas-free Brain Network Transformer

Questo articolo presenta il "Transformer di Rete Cerebrale senza Atlante" (atlas-free BNT), un nuovo approccio che elimina le limitazioni degli atlanti cerebrali fissi utilizzando parcellazioni individuali dai dati fMRI per generare rappresentazioni più robuste e generalizzabili, superando le prestazioni dei metodi basati su atlanti in compiti di classificazione e predizione.

Shuai Huang, Xuan Kan, James J. Lah + 1 more2026-02-27🧬 q-bio

Improving Discrete Diffusion Unmasking Policies Beyond Explicit Reference Policies

Questo lavoro propone un programma di schedulazione appreso, formulato come un processo decisionale di Markov regolarizzato, che supera le euristiche tradizionali per migliorare le prestazioni dei modelli di diffusione discreta nel task di generazione linguistica.

Chunsan Hong, Seonho An, Min-Soo Kim + 1 more2026-02-27💬 cs.CL

Multi-level informed optimization via decomposed Kriging for large design problems under uncertainty

Il paper propone un approccio di ottimizzazione multi-livello basato su Kriging decomposto che, adattando gerarchicamente e ortogonalmente i surrogate, risolve in modo efficiente e preciso problemi ingegneristici complessi ad alta dimensionalità sotto incertezza, superando i limiti di scalabilità e precisione dei metodi attuali.

Enrico Ampellio, Blazhe Gjorgiev, Giovanni Sansavini2026-02-27⚡ eess

DeepMartingale: Duality of the Optimal Stopping Problem with Expressivity and High-Dimensional Hedging

Il paper propone DeepMartingale, un framework di deep learning basato su una formulazione duale pura che risolve problemi di arresto ottimale in alta dimensione fornendo limiti superiori calcolabili, strategie di copertura scalabili e garantendo la convergenza senza soffrire della maledizione della dimensionalità.

Junyan Ye, Hoi Ying Wong2026-02-27📊 stat

Learning to Answer from Correct Demonstrations

Questo lavoro propone un metodo di apprendimento per la generazione di risposte basato sull'apprendimento per imitazione in contesti a scelta multipla, che supera i limiti della massimizzazione della verosimiglianza assumendo solo che il modello di ricompensa sottostante appartenga a una classe a complessità limitata, garantendo così una complessità di campionamento logaritmica e prestazioni ottimali anche con dimostrazioni adattive.

Nirmit Joshi, Gene Li, Siddharth Bhandari + 3 more2026-02-27📊 stat

Throwing Vines at the Wall: Structure Learning via Random Search

Questo articolo propone un nuovo approccio basato sulla ricerca casuale e su un quadro statistico di insiemi di confidenza per migliorare l'apprendimento della struttura delle copule a vite, superando le prestazioni degli algoritmi greedy esistenti e fornendo garanzie teoriche.

Thibault Vatter, Thomas Nagler2026-02-27📊 stat

Inference-Cost-Aware Dynamic Tree Construction for Efficient Inference in Large Language Models

Il paper presenta CAST, un nuovo metodo di decodifica speculativa che ottimizza dinamicamente la struttura dell'albero in base ai costi di inferenza (come configurazioni GPU e dimensioni del batch), ottenendo velocità fino a 5,2 volte superiori rispetto ai metodi convenzionali e superando le tecniche state-of-the-art esistenti dal 5% al 20%.

Yinrong Hong, Zhiquan Tan, Kai Hu2026-02-27💬 cs.CL

Simplex-to-Euclidean Bijections for Categorical Flow Matching

Il paper propone un metodo per l'apprendimento e il campionamento di distribuzioni di probabilità sul simplezzo mappandolo in uno spazio euclideo tramite biezioni lisce basate sulla geometria di Aitchison e un'interpolazione di Dirichlet, permettendo così una modellazione della densità nello spazio euclideo con recupero esatto della distribuzione discreta originale.

Bernardo Williams, Victor M. Yeom-Song, Marcelo Hartmann + 1 more2026-02-27🤖 cs.LG

Temporal Sparse Autoencoders: Leveraging the Sequential Nature of Language for Interpretability

Il paper introduce i Temporal Sparse Autoencoders (T-SAEs), un metodo che incorpora una perdita di contrasto temporale per sfruttare la struttura sequenziale del linguaggio, permettendo così di scoprire concetti semantici più coerenti e interpretabili rispetto ai tradizionali Sparse Autoencoders senza richiedere segnali semantici espliciti.

Usha Bhalla, Alex Oesterling, Claudio Mayrink Verdun + 2 more2026-02-27💬 cs.CL

Intelligence per Watt: Measuring Intelligence Efficiency of Local AI

Questo studio propone la metrica "intelligenza per watt" per valutare l'efficienza energetica dell'inferenza locale di modelli linguistici, dimostrando che i dispositivi locali possono gestire con accuratezza la maggior parte delle query reali e redistribuire efficacemente il carico rispetto all'infrastruttura cloud centralizzata.

Jon Saad-Falcon, Avanika Narayan, Hakki Orhun Akengin + 12 more2026-02-27💬 cs.CL

VLM-Pruner: Buffering for Spatial Sparsity in an Efficient VLM Centrifugal Token Pruning Paradigm

Il paper presenta VLM-Pruner, un algoritmo di pruning dei token privo di addestramento che bilancia ridondanza e sparsità spaziale attraverso un paradigma centrifugo e un criterio di buffering, migliorando l'efficienza e la velocità di inferenza dei modelli visione-linguaggio senza comprometterne le prestazioni.

Zhenkai Wu, Xiaowen Ma, Zhenliang Ni + 4 more2026-02-27🤖 cs.LG

UniQL: Unified Quantization and Low-rank Compression for Adaptive Edge LLMs

Il paper presenta UniQL, un framework unificato di post-training che combina quantizzazione e compressione a basso rango con potatura configurabile in tempo reale, permettendo di distribuire modelli linguistici su dispositivi edge con riduzioni di memoria fino a 5,7 volte e miglioramenti del throughput fino a 3,4 volte mantenendo un'accuratezza elevata.

Hung-Yueh Chiang, Chi-Chih Chang, Yu-Chen Lu + 4 more2026-02-27🤖 cs.AI

One-Step Diffusion Samplers via Self-Distillation and Deterministic Flow

Questo lavoro introduce un campionatore di diffusione a un singolo passo che, combinando l'auto-distillazione per allineare le traiettorie e un nuovo peso di importanza a flusso deterministico con regolarizzazione di consistenza volumetrica, permette di generare campioni di alta qualità e stime stabili dell'ELBO con un numero di valutazioni della rete inferiore di ordini di grandezza rispetto ai metodi esistenti.

Pascal Jutras-Dube, Jiaru Zhang, Ziran Wang + 1 more2026-02-27📊 stat

Imitation Game: Reproducing Deep Learning Bugs Leveraging an Intelligent Agent

Il paper presenta RepGen, un approccio automatizzato basato su agenti intelligenti e LLM che supera le sfide della riproducibilità dei bug nel deep learning, ottenendo un tasso di successo dell'80,19% e riducendo significativamente tempi e carico cognitivo per gli sviluppatori.

Mehil B Shah, Mohammad Masudur Rahman, Foutse Khomh2026-02-27🤖 cs.AI

LeanCat: A Benchmark Suite for Formal Category Theory in Lean (Part I: 1-Categories)

Il paper introduce LeanCat, un benchmark di 100 task di teoria delle categorie in Lean che rivela un grave divario nell'astrazione degli attuali modelli linguistici, dimostrando come l'uso di agenti con recupero dinamico e verifica iterativa (LeanBridge) sia essenziale per raddoppiare le prestazioni in domini astratti.

Rongge Xu, Hui Dai, Yiming Fu + 5 more2026-02-27🤖 cs.AI

WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks

Il paper presenta WebGym, il più grande ambiente open-source per l'addestramento di agenti web visivi su quasi 300.000 compiti reali, che grazie a un sistema di rollout asincrono ad alta velocità e a un'ampia diversità di task, permette di ottenere un modello basato su Qwen-3-VL-8B-Instruct che supera le prestazioni di modelli proprietari come GPT-4o e GPT-5-Thinking su test fuori distribuzione.

Hao Bai, Alexey Taymanov, Tong Zhang + 2 more2026-02-27🤖 cs.LG

← Precedente Successivo →