Learning to Pay Attention: Unsupervised Modeling of Attentive and Inattentive Respondents in Survey Data

Questo lavoro propone un quadro unificato e senza etichette per rilevare i rispondenti disattenti nei sondaggi, dimostrando che l'efficacia del rilevamento dipende principalmente dalla struttura coerente dello strumento di indagine piuttosto che dalla complessità del modello, rivelando un allineamento critico tra i principi psicometrici di affidabilità e la rilevabilità algoritmica.

Ilias Triantafyllopoulos, Panos Ipeirotis2026-03-04🤖 cs.AI

Spectral Regularization for Diffusion Models

Il paper propone un framework di regolarizzazione spettrale a livello di perdita che, integrando funzioni di costo differenziabili nei domini di Fourier e wavelet durante l'addestramento dei modelli di diffusione senza modificarne l'architettura, migliora la qualità dei campioni generati bilanciando le frequenze e preservando la struttura multi-scala, specialmente ad alte risoluzioni.

Satish Chandran, Nicolas Roque dos Santos, Yunshu Wu + 2 more2026-03-04🤖 cs.LG

Can Computational Reducibility Lead to Transferable Models for Graph Combinatorial Optimization?

Questo articolo propone un modello neurale basato su GCON e funzioni di perdita energy-based che, sfruttando strategie di preaddestramento informate dalla riducibilità computazionale, dimostra la fattibilità di trasferire conoscenze e accelerare la convergenza tra diversi problemi di ottimizzazione combinatoria su grafi, un passo fondamentale verso la creazione di modelli fondazionali per tale ambito.

Semih Cantürk, Thomas Sabourin, Frederik Wenkel + 2 more2026-03-04🤖 cs.AI

MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models

Il paper presenta MUSE, una piattaforma open-source per la valutazione unificata della sicurezza multimodale dei grandi modelli linguistici che integra la generazione automatica di payload cross-modali, algoritmi di attacco multi-turno e un sistema di giudizio basato su LLM, rivelando come le strategie di attacco multi-turno e il cambio di modalità tra i turni possano compromettere significativamente le difese dei modelli anche quando questi mostrano un alto tasso di rifiuto negli input singoli.

Zhongxi Wang, Yueqian Lin, Jingyang Zhang + 2 more2026-03-04⚡ eess

What Capable Agents Must Know: Selection Theorems for Robust Decision-Making under Uncertainty

Il documento dimostra che agenti capaci di agire con competenza in condizioni di incertezza devono necessariamente implementare stati interni strutturati e predittivi, poiché un basso rimpianto medio su compiti di previsione condizionale impone la distinzione tra esiti ad alto margine, portando al recupero approssimato del kernel di transizione interventivo o di stati di memoria simili a credenze.

Aran Nayebi2026-03-04🧬 q-bio

Thermodynamic Regulation of Finite-Time Gibbs Training in Energy-Based Models: A Restricted Boltzmann Machine Study

Questo studio propone un quadro di regolazione termodinamica endogena per l'addestramento delle Restricted Boltzmann Machines, in cui la temperatura evolve dinamicamente per mitigare l'instabilità strutturale e il congelamento dei campioni, garantendo la stabilità globale dei parametri e migliorando le prestazioni di normalizzazione rispetto ai metodi a temperatura fissa.

Görkem Can Süleymanoğlu2026-03-04🤖 cs.LG

Functional Properties of the Focal-Entropy

Questo lavoro fornisce una fondazione teorica per la funzione di focal-loss, analizzandone le proprietà dell'entropia focale per dimostrare come essa amplifichi le probabilità intermedie, sopprima quelle elevate e induca una sovrastima della soppressione in scenari di forte squilibrio di classe, offrendo così una comprensione sistematica dei compromessi introdotti nell'apprendimento imbalanced.

Jaimin Shah, Martina Cardone, Alex Dytso2026-03-04📊 stat

Give me scissors: Collision-Free Dual-Arm Surgical Assistive Robot for Instrument Delivery

Questo articolo presenta un robot assistivo chirurgico a due bracci in grado di consegnare strumenti in modo autonomo e privo di collisioni, utilizzando modelli linguaggio-visione per interpretare i comandi e un framework di programmazione quadratica per evitare ostacoli in tempo reale, raggiungendo un tasso di successo dell'83,33% in ambienti dinamici.

Xuejin Luo, Shiquan Sun, Runshi Zhang + 2 more2026-03-04🤖 cs.LG