Event-Only Drone Trajectory Forecasting with RPM-Modulated Kalman Filtering

Questo lavoro presenta un metodo di previsione della traiettoria dei droni basato esclusivamente su eventi, che estrae la velocità di rotazione delle eliche dai dati grezzi e la fonde in un filtro di Kalman consapevole delle RPM, ottenendo risultati superiori rispetto agli approcci basati su apprendimento e ai filtri di Kalman convenzionali senza ricorrere a immagini RGB o dati di addestramento.

Hari Prasanth S. M., Pejman Habibiroudkenar, Eerik Alamikkotervo + 2 more2026-03-03⚡ eess

3D Field of Junctions: A Noise-Robust, Training-Free Structural Prior for Volumetric Inverse Problems

Il paper propone il "3D Field of Junctions" (3D FoJ), un nuovo prior strutturale privo di addestramento che ottimizza giunzioni di cunei 3D per denoisare e ricostruire volumi in problemi inversi con basso rapporto segnale-rumore, superando i metodi classici e neurali in applicazioni come la tomografia a raggi X, la criotomografia elettronica e la pulizia di nuvole di punti lidar.

Namhoon Kim, Narges Moeini, Justin Romberg + 1 more2026-03-03⚡ eess

Data Augmentation via Mixed Class Interpolation using Cycle-Consistent Generative Adversarial Networks Applied to Cross-Domain Imagery

Questo articolo propone e valuta un nuovo metodo di aumento dei dati basato sull'interpolazione di classi miste tramite CycleGAN (C2GMA) per generare immagini non visibili a partire da quelle visibili, migliorando significativamente l'accuratezza della classificazione nel dominio SAR rispetto alle strategie tradizionali.

Hiroshi Sasaki, Chris G. Willcocks, Toby P. Breckon2026-03-02🤖 cs.LG

Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases

Il paper affronta il problema dell'iper-ottimizzazione della ricompensa nei modelli di diffusione identificando i bias induttivi temporali e di primacy come cause principali, proponendo quindi l'algoritmo TDPO-R che sfrutta il bias induttivo temporale e resetta i neuroni attivi del critic per mitigare tale fenomeno e migliorare l'allineamento con le preferenze umane.

Ziyi Zhang, Sen Zhang, Yibing Zhan + 3 more2026-03-02🤖 cs.LG

Stereo-Talker: Audio-driven 3D Human Synthesis with Prior-Guided Mixture-of-Experts

Il paper presenta Stereo-Talker, un sistema innovativo di sintesi video 3D guidato dall'audio che genera video parlanti fotorealistici con sincronizzazione labiale precisa e gesti espressivi, sfruttando un approccio a due stadi che integra prioristiche di modelli linguistici su larga scala e un meccanismo Mixture-of-Experts guidato da prior per garantire coerenza temporale e controllo continuo del punto di vista.

Xiang Deng, Youxin Pang, Xiaochen Zhao + 6 more2026-03-02💻 cs

CLAP: Unsupervised 3D Representation Learning for Fusion 3D Perception via Curvature Sampling and Prototype Learning

Il paper presenta CLAP, un metodo di pre-addestramento non supervisionato che combina campionamento basato sulla curvatura e apprendimento di prototipi per unire efficacemente immagini e nuvole di punti in uno spazio di caratteristiche comune, ottenendo significativi miglioramenti nelle prestazioni della percezione 3D rispetto agli stati dell'arte.

Runjian Chen, Hang Zhang, Avinash Ravichandran + 4 more2026-03-02💻 cs