OpenMarcie: Dataset for Multimodal Action Recognition in Industrial Environments

OpenMarcie è il più grande dataset multimodale esistente per il riconoscimento delle azioni umane in ambienti industriali, composto da oltre 37 ore di dati eterogenei raccolti da 36 partecipanti durante compiti di assemblaggio e collaborazione, e progettato per supportare l'ottimizzazione della produzione e la sicurezza nei contesti di fabbricazione intelligente.

Hymalai Bello, Lala Ray, Joanna Sorysz + 2 more2026-03-04⚡ eess

From Fewer Samples to Fewer Bits: Reframing Dataset Distillation as Joint Optimization of Precision and Compactness

Il paper propone QuADD, un quadro unificato per la distillazione dei dataset che ottimizza congiuntamente il numero di campioni e la precisione dei dati tramite quantizzazione differenziabile, superando i metodi esistenti in termini di efficienza informativa e prestazioni su compiti di classificazione e gestione dei fasci 3GPP.

My H. Dinh, Aditya Sant, Akshay Malhotra + 2 more2026-03-04🤖 cs.AI

Deep Learning Based Wildfire Detection for Peatland Fires Using Transfer Learning

Questo lavoro presenta un approccio basato sull'apprendimento profondo e sul transfer learning per migliorare l'accuratezza e la robustezza del rilevamento degli incendi di torbiera, adattando modelli preaddestrati su incendi forestali generici a un dataset specifico di immagini e video della Malesia per superare le sfide poste dalle caratteristiche visive uniche di questi incendi.

Emadeldeen Hamdan, Ahmad Faiz Tharima, Mohd Zahirasri Mohd Tohir + 4 more2026-03-04🤖 cs.AI

MUSE: A Run-Centric Platform for Multimodal Unified Safety Evaluation of Large Language Models

Il paper presenta MUSE, una piattaforma open-source per la valutazione unificata della sicurezza multimodale dei grandi modelli linguistici che integra la generazione automatica di payload cross-modali, algoritmi di attacco multi-turno e un sistema di giudizio basato su LLM, rivelando come le strategie di attacco multi-turno e il cambio di modalità tra i turni possano compromettere significativamente le difese dei modelli anche quando questi mostrano un alto tasso di rifiuto negli input singoli.

Zhongxi Wang, Yueqian Lin, Jingyang Zhang + 2 more2026-03-04⚡ eess

Biomechanically Accurate Gait Analysis: A 3d Human Reconstruction Framework for Markerless Estimation of Gait Parameters

Questo articolo presenta un framework interpretabile dal punto di vista biomeccanico per l'analisi del passo che, attraverso la ricostruzione 3D del corpo umano da video, estrae marcatori analoghi a quelli dei sistemi di motion capture per stimare con precisione i parametri cinematici in modo markerless, scalabile e clinicamente applicabile.

Akila Pemasiri, Ethan Goan, Glen Lichtwark + 3 more2026-03-04⚡ eess

SGMA: Semantic-Guided Modality-Aware Segmentation for Remote Sensing with Incomplete Multimodal Data

Il paper propone SGMA, un framework innovativo per la segmentazione semantica di immagini telerilevate con dati multimodali incompleti, che utilizza moduli di fusione guidata semantica e campionamento consapevole della modalità per bilanciare l'apprendimento, ridurre la variabilità intra-classe e risolvere le incongruenze tra sensori diversi, superando così i limiti degli approcci esistenti.

Lekang Wen, Liang Liao, Jing Xiao + 1 more2026-03-04💻 cs

Beyond Anatomy: Explainable ASD Classification from rs-fMRI via Functional Parcellation and Graph Attention Networks

Questo studio dimostra che l'utilizzo di parcellazioni cerebrali funzionali (MSDL) invece di quelle anatomiche, combinate con un ensemble di Graph Attention Networks e tecniche di spiegabilità, permette di raggiungere un'accuratezza del 95% nella classificazione dell'autismo tramite rs-fMRI, superando i benchmark esistenti e identificando hub neurali coerenti con la neuropatologia dell'ASD.

Syeda Hareem Madani, Noureen Bibi, Adam Rafiq Jeraj + 3 more2026-03-04💻 cs

Functional Properties of the Focal-Entropy

Questo lavoro fornisce una fondazione teorica per la funzione di focal-loss, analizzandone le proprietà dell'entropia focale per dimostrare come essa amplifichi le probabilità intermedie, sopprima quelle elevate e induca una sovrastima della soppressione in scenari di forte squilibrio di classe, offrendo così una comprensione sistematica dei compromessi introdotti nell'apprendimento imbalanced.

Jaimin Shah, Martina Cardone, Alex Dytso2026-03-04📊 stat