VISION-ICE: Video-based Interpretation and Spatial Identification of Arrhythmia Origins via Neural Networks in Intracardiac Echocardiography

Il paper presenta VISION-ICE, un framework basato su reti neurali convoluzionali 3D che analizza i video dell'ecocardiografia intracardiaca per localizzare automaticamente l'origine delle aritmie, dimostrando la fattibilità di ridurre i tempi procedurali e migliorare le decisioni cliniche.

Dorsa EPMoghaddam, Feng Gao, Drew Bernard + 3 more2026-02-25🤖 cs.LG

Large-scale Photorealistic Outdoor 3D Scene Reconstruction from UAV Imagery Using Gaussian Splatting Techniques

Questo studio presenta un pipeline end-to-end che combina lo streaming video in tempo reale da droni, la fusione sensoriale e l'ottimizzazione del Gaussian Splatting 3D per generare ricostruzioni 3D fotorealistiche di grandi scenari esterni con latenza ridotta e prestazioni di rendering superiori rispetto ai metodi basati su NeRF.

Christos Maikos, Georgios Angelidis, Georgios Th. Papadopoulos2026-02-25💻 cs

SimLBR: Learning to Detect Fake Images by Learning to Detect Real Images

Il paper presenta SimLBR, un framework efficiente che migliora la generalizzazione nella rilevazione di immagini fake definendo un confine decisionale attorno alla distribuzione delle immagini reali tramite la regolarizzazione del blending latente, ottenendo risultati superiori su benchmark difficili e introducendo nuove metriche di valutazione orientate all'affidabilità.

Aayush Dhakal, Subash Khanal, Srikumar Sastry + 4 more2026-02-25💻 cs

MedCLIPSeg: Probabilistic Vision-Language Adaptation for Data-Efficient and Generalizable Medical Image Segmentation

Il paper presenta MedCLIPSeg, un nuovo framework che adatta i modelli visione-linguaggio CLIP per la segmentazione di immagini mediche attraverso un'attenzione probabilistica e una perdita contrastiva, ottenendo risultati superiori in termini di accuratezza, efficienza dei dati e generalizzazione su diverse modalità di imaging e organi.

Taha Koleilat, Hojat Asgariandehkordi, Omid Nejati Manzari + 3 more2026-02-25💬 cs.CL

SceMoS: Scene-Aware 3D Human Motion Synthesis by Planning with Geometry-Grounded Tokens

SceMoS è un framework innovativo per la sintesi di movimenti umani 3D guidati dal testo che, disaccoppiando la pianificazione globale dall'esecuzione locale tramite rappresentazioni 2D (immagini BEV e mappe di altezza), raggiunge uno stato dell'arte nel realismo e nell'accuratezza dei contatti riducendo al contempo i parametri di addestramento rispetto ai metodi basati su dati 3D completi.

Anindita Ghosh, Vladislav Golyanik, Taku Komura + 3 more2026-02-25💻 cs