Multimodal Dataset Distillation Made Simple by Prototype-Guided Data Synthesis

Il paper propone un nuovo framework di distillazione dei dataset multimodali privo di apprendimento che, sfruttando CLIP per l'estrazione di embedding e un decodificatore unCLIP per la sintesi di immagini guidate da prototipi, supera i metodi esistenti garantendo una generalizzazione superiore tra diverse architetture senza richiedere costosi processi di ottimizzazione.

Junhyeok Choi, Sangwoo Mo, Minwoo Chae2026-03-02💻 cs

One2Scene: Geometric Consistent Explorable 3D Scene Generation from a Single Image

Il paper introduce One2Scene, un framework innovativo che genera scene 3D esplorabili e geometricamente coerenti partendo da una singola immagine, decomponendo il problema in tre fasi chiave: generazione di viste panoramiche, costruzione di un'impalcatura 3D esplicita tramite Gaussian Splatting e generazione di nuove viste fotorealistiche, superando così le distorsioni geometriche tipiche dei metodi esistenti.

Pengfei Wang, Liyi Chen, Zhiyuan Ma + 3 more2026-03-02💻 cs

Motion-aware Event Suppression for Event Cameras

Questo lavoro presenta il primo framework per la soppressione di eventi basata sul movimento, un'architettura leggera in tempo reale che segmenta e prevede anticipatamente il moto degli oggetti e della telecamera per filtrare gli eventi dinamici, migliorando significativamente l'accuratezza della segmentazione e le prestazioni delle applicazioni di visione a valle come l'inferenza dei Transformer e la odometria visiva.

Roberto Pellerito, Nico Messikommer, Giovanni Cioffi + 2 more2026-03-02💻 cs