cs.LG articoli | Gist.Science

TripleSumm: Adaptive Triple-Modality Fusion for Video Summarization

Il paper presenta TripleSumm, un nuovo approccio che fonde in modo adattivo le modalità visiva, testuale e audio per la sintesi video, accompagnato da MoSu, il primo benchmark su larga scala che fornisce tutte e tre le modalità, con risultati che superano lo stato dell'arte su quattro dataset.

Sumin Kim, Hyemin Jeong, Mingu Kang + 3 more2026-03-03🤖 cs.LG

PARWiS: Winner determination under shoestring budgets using active pairwise comparisons

Questo studio presenta e valuta le varianti estese dell'algoritmo PARWiS per la determinazione del vincitore tramite confronti a coppie attivi sotto vincoli di budget severi, dimostrando che l'approccio base e quello basato sul reinforcement learning superano le strategie di baseline su dataset sintetici e reali, sebbene l'integrazione di informazioni contestuali richieda ulteriori ottimizzazioni.

Shailendra Bhandari2026-03-03🤖 cs.LG

Scaling of learning time for high dimensional inputs

Questo studio teorico dimostra che, in un modello di apprendimento hebbiano per l'analisi delle componenti indipendenti, i tempi di apprendimento per input ad alta dimensionalità seguono una scala supralineare, diventando rapidamente proibitivi a causa della riduzione dei gradienti iniziali, il che rivela un limite fondamentale per l'ottimizzazione delle reti neurali complesse.

Carlos Stein Brito2026-03-03🧬 q-bio

Monocular 3D Object Position Estimation with VLMs for Human-Robot Interaction

Questo lavoro presenta un modello di Vision-Language Model (VLM) finetunato che, partendo da immagini monococulari e comandi linguistici, stima con precisione la posizione 3D degli oggetti per migliorare l'interazione uomo-robot, raggiungendo un errore mediano di 13 mm.

Ari Wahl, Dorian Gawlinski, David Przewozny + 3 more2026-03-03🤖 cs.LG

AgilePruner: An Empirical Study of Attention and Diversity for Adaptive Visual Token Pruning in Large Vision-Language Models

Il paper "AgilePruner" presenta un'analisi empirica che evidenzia i limiti dei metodi di pruning basati su attenzione e diversità nei Large Vision-Language Models, proponendo un meccanismo adattivo che combina dinamicamente queste strategie in base alla complessità dell'immagine per migliorare le prestazioni e ridurre le allucinazioni.

Changwoo Baek, Jouwon Song, Sohyeon Kim + 1 more2026-03-03🤖 cs.LG

MOSAIC: A Unified Platform for Cross-Paradigm Comparison and Evaluation of Homogeneous and Heterogeneous Multi-Agent RL, LLM, VLM, and Human Decision-Makers

Il paper presenta MOSAIC, una piattaforma open-source che unifica ambienti di apprendimento per agenti multipli permettendo il confronto equo e riproducibile tra paradigmi eterogenei come RL, LLM, VLM e decisori umani tramite un protocollo IPC isolato e un'interfaccia unificata.

Abdulhamid M. Mousa, Yu Fu, Rakhmonberdi Khajiev + 5 more2026-03-03🤖 cs.LG

S2O: Enhancing Adversarial Training with Second-Order Statistics of Weights

Questo articolo propone S2O, un nuovo approccio che migliora l'addestramento avversariale trattando i pesi delle reti neurali come variabili casuali e ottimizzando le loro statistiche del secondo ordine per rilassare l'ipotesi di indipendenza nei framework PAC-Bayesiani, ottenendo così un limite di generalizzazione robusta più stretto e prestazioni superiori.

Gaojie Jin, Xinping Yi, Wei Huang + 2 more2026-03-03🤖 cs.LG

GlassMol: Interpretable Molecular Property Prediction with Concept Bottleneck Models

Il paper presenta GlassMol, un modello di concetto interpretabile che supera i compromessi tra accuratezza e trasparenza nella previsione delle proprietà molecolari colmando le lacune di rilevanza, annotazione e capacità attraverso una selezione automatizzata dei concetti guidata da LLM.

Oscar Rivera, Ziqing Wang, Matthieu Dagommer + 2 more2026-03-03🤖 cs.LG

The Impact of Battery Cell Configuration on Electric Vehicle Performance: An XGBoost-Based Classification with SHAP Interpretability

Questo studio utilizza un modello XGBoost e l'interpretazione SHAP per dimostrare che, sebbene un maggior numero di celle delle batterie migliori inizialmente le prestazioni di accelerazione dei veicoli elettrici, è necessario un equilibrio tra complessità del sistema e configurazione architettonica per ottimizzare le prestazioni complessive.

Santanam Wishal, Louis Filiepe Tio Jansel, Matthew Abednego Inkiriwang + 1 more2026-03-03🤖 cs.LG

Beyond Reward: A Bounded Measure of Agent Environment Coupling

Il paper introduce la "bipredicibilità" (P) e il suo monitor "Information Digital Twin" (IDT) come una misura informativa in tempo reale e provatamente limitata per rilevare precocemente il degrado dell'interazione agente-ambiente in sistemi RL, superando i limiti delle metriche basate sulla ricompensa.

Wael Hafez, Cameron Reid, Amit Nazeri2026-03-03🤖 cs.LG

Attention Smoothing Is All You Need For Unlearning

Il paper propone l'Unlearning con Smussatura dell'Attenzione (ASU), un framework che risolve il compromesso tra oblio e utilità nei modelli linguistici appiattendo le distribuzioni di attenzione per cancellare in modo stabile le informazioni memorizzate senza compromettere la coerenza delle risposte.

Saleh Zare Zade, Xiangyu Zhou, Sijia Liu + 1 more2026-03-03💬 cs.CL

JailNewsBench: Multi-Lingual and Regional Benchmark for Fake News Generation under Jailbreak Attacks

Il paper presenta JailNewsBench, il primo benchmark multilingue e regionale su larga scala per valutare la resilienza dei modelli linguistici di grandi dimensioni (LLM) contro la generazione di notizie false indotta da attacchi jailbreak, rivelando significativi squilibri nelle difese di sicurezza tra diverse lingue e aree geografiche.

Masahiro Kaneko, Ayana Niwa, Timothy Baldwin2026-03-03💬 cs.CL

Integrating LTL Constraints into PPO for Safe Reinforcement Learning

Questo articolo presenta PPO-LTL, un framework che integra vincoli di Logica Temporale Lineare (LTL) nell'algoritmo Proximal Policy Optimization per garantire l'apprendimento per rinforzo sicuro, traducendo le violazioni in segnali di penalità tramite automi di Büchi e ottimizzando la politica con uno schema Lagrangiano.

Maifang Zhang, Hang Yu, Qian Zuo + 3 more2026-03-03🤖 cs.LG

Theoretical Perspectives on Data Quality and Synergistic Effects in Pre- and Post-Training Reasoning Models

Questo lavoro analizza teoricamente e verifica sperimentalmente come la qualità e la scala dei dati influenzino diversamente l'addestramento pre- e post-training dei modelli linguistici, dimostrando che il fine-tuning supervisionato beneficia di piccoli set di esempi difficili mentre il reinforcement learning richiede grandi volumi di dati meno complessi.

Adel Javanmard, Baharan Mirzasoleiman, Vahab Mirrokni2026-03-03📊 stat

I Can't Believe It's Not Robust: Catastrophic Collapse of Safety Classifiers under Embedding Drift

Lo studio rivela che i classificatori di sicurezza addestrati su embedding fissi subiscono un collasso catastrofico a causa della deriva delle rappresentazioni nei modelli di ragionamento istruiti, generando fallimenti silenziosi ad alta confidenza e rendendo paradossalmente più difficile proteggere i sistemi allineati rispetto a quelli di base.

Subramanyam Sahoo, Vinija Jain, Divya Chaudhary + 1 more2026-03-03💬 cs.CL

Nonconvex Latent Optimally Partitioned Block-Sparse Recovery via Log-Sum and Minimax Concave Penalties

Il paper propone due nuovi metodi di regolarizzazione non convessa, LogLOP-l2/l1 e AdaLOP-l1/l2, basati su formulazioni variazionali delle penalità log-sum e MCP per il recupero di segnali blocchi-sparsi con partizioni sconosciute, sviluppando algoritmi ADMM efficienti che superano gli approcci esistenti in termini di accuratezza e compatibilità con diverse funzioni di fedeltà ai dati.

Takanobu Furuhashi, Hiroki Kuroda, Masahiro Yukawa + 3 more2026-03-03📊 stat

GPU-friendly and Linearly Convergent First-order Methods for Certifying Optimal $k$ -sparse GLMs

Questo lavoro propone un quadro unificato di ottimizzazione prossimale, accelerabile su GPU e a convergenza lineare, per certificare l'ottimalità nei modelli lineari generalizzati sparsi, superando i limiti computazionali dei metodi esistenti attraverso nuove routine log-lineari e uno schema di riavvio basato sul gap di dualità.

Jiachang Liu, Andrea Lodi, Soroosh Shafiee2026-03-03🤖 cs.LG

PAC Guarantees for Reinforcement Learning: Sample Complexity, Coverage, and Structure

Questo articolo esamina i progressi compiuti tra il 2018 e il 2025 nelle garanzie PAC per l'apprendimento per rinforzo, proponendo il nuovo framework CSO (Copertura-Struttura-Obiettivo) come strumento interpretativo per analizzare la complessità dei campioni, classificare i risultati teorici e fornire strumenti pratici per gli utenti.

Joshua Steier2026-03-03📊 stat

From GEV to ResLogit: Spatially Correlated Discrete Choice Models for Pedestrian Movement Prediction

Lo studio dimostra che, per la previsione del movimento pedonale in contesti ad alta frequenza, un modello ResLogit che apprende le correlazioni spaziali tramite correzioni residue supera le strutture GEV tradizionali, offrendo un migliore adattamento ai dati e un'interpretazione coerente degli errori.

Rulla Al-Haideri, Bilal Farooq2026-03-03🤖 cs.LG

Truth as a Trajectory: What Internal Representations Reveal About Large Language Model Reasoning

Il paper introduce "Truth as a Trajectory" (TaT), un metodo che analizza le variazioni geometriche degli stati nascosti tra i livelli dei modelli linguistici invece delle attivazioni statiche, permettendo di distinguere il ragionamento valido dai comportamenti spurii e superando i limiti dei metodi di spiegabilità tradizionali.

Hamed Damirchi, Ignacio Meza De la Jara, Ehsan Abbasnejad + 3 more2026-03-03💬 cs.CL

← Precedente Successivo →

cs.LG