Dr.Occ: Depth- and Region-Guided 3D Occupancy from Surround-View Cameras for Autonomous Driving

El artículo presenta Dr. Occ, un marco de predicción de ocupación 3D guiado por profundidad y regiones que utiliza un transformador de vista 2D-a-3D basado en MoGe-2 y un transformador de expertos adaptativo para resolver problemas de desalineación geométrica y desequilibrio espacial, logrando mejoras significativas en el rendimiento sobre el conjunto de datos Occ3D-nuScenes.

Xubo Zhu, Haoyang Zhang, Fei He + 4 more2026-03-06💻 cs

MultiShadow: Multi-Object Shadow Generation for Image Compositing via Diffusion Model

El artículo presenta MultiShadow, un enfoque basado en modelos de difusión que genera sombras físicamente plausibles y consistentes para múltiples objetos insertados en una escena mediante la integración de características espaciales densas y tokens de posición aprendidos, superando así las limitaciones de los métodos existentes enfocados en objetos individuales.

Waqas Ahmed, Dean Diepeveen, Ferdous Sohel2026-03-06💻 cs

DMD-augmented Unpaired Neural Schrödinger Bridge for Ultra-Low Field MRI Enhancement

Los autores proponen un marco de traducción no emparejado basado en el Puente de Schrödinger Neuronal, enriquecido con emparejamiento de distribuciones guiado por difusión y regularizadores de preservación anatómica, para mejorar la calidad y el realismo de las imágenes de resonancia magnética cerebral de campo ultra bajo (64 mT) alineándolas con las de alto campo (3 T).

Youngmin Kim, Jaeyun Shin, Jeongchan Kim + 5 more2026-03-06💻 cs

TumorFlow: Physics-Guided Longitudinal MRI Synthesis of Glioblastoma Growth

El artículo presenta TumorFlow, un marco generativo guiado por física que sintetiza secuencias de resonancia magnética cerebral tridimensionales realistas y temporalmente coherentes para visualizar la progresión y la infiltración del glioblastoma en pacientes específicos, combinando modelos de crecimiento biológico con aprendizaje profundo para mejorar la planificación del tratamiento y la generación de datos sintéticos.

Valentin Biller, Niklas Bubeck, Lucas Zimmer + 6 more2026-03-06💻 cs

A Unified Framework for Joint Detection of Lacunes and Enlarged Perivascular Spaces

Este artículo presenta un marco unificado de detección conjunta para lacunas y espacios perivasculares agrandados que, mediante mecanismos de atención cruzada inicializada en cero, pérdidas de consistencia topológica y calibración inferencial anatómica, supera el estado del arte en precisión y robustez al resolver los desafíos de interferencia de características y desequilibrio de clases en la enfermedad de los vasos sanguíneos cerebrales.

Lucas He, Krinos Li, Hanyuan Zhang + 7 more2026-03-06💻 cs

Recognition of Daily Activities through Multi-Modal Deep Learning: A Video, Pose, and Object-Aware Approach for Ambient Assisted Living

Este artículo presenta un enfoque de aprendizaje profundo multi-modal que integra redes neuronales convolucionales 3D, datos de pose humana y detección de objetos mediante mecanismos de atención cruzada para mejorar la precisión en el reconocimiento de actividades diarias en entornos de asistencia ambiental para adultos mayores.

Kooshan Hashemifard, Pau Climent-Pérez, Francisco Florez-Revuelta2026-03-06💻 cs

Fusion and Grouping Strategies in Deep Learning for Local Climate Zone Classification of Multimodal Remote Sensing Data

Este estudio analiza diversas estrategias de fusión y agrupamiento en modelos de aprendizaje profundo para la clasificación de Zonas Climáticas Locales utilizando datos de teledetección multimodal, demostrando que una arquitectura híbrida combinada con agrupación de bandas y fusión de etiquetas logra la mayor precisión y mejora la predicción de clases subrepresentadas en el conjunto de datos So2Sat LCZ42.

Ancymol Thomas, Jaya Sreevalsan-Nair2026-03-06💻 cs