Reflectance Prediction-based Knowledge Distillation for Robust 3D Object Detection in Compressed Point Clouds

Este artículo propone un marco de detección de objetos 3D basado en la destilación de conocimiento con predicción de reflectancia (RPKD) que, al descartar la reflectancia durante la transmisión comprimida y reconstruirla mediante un módulo de predicción geométrica, mejora la robustez y precisión de la detección en sistemas de percepción colaborativa con ancho de banda limitado.

Hao Jing, Anhong Wang, Yifan Zhang + 2 more2026-02-27💻 cs

LinGuinE: Longitudinal Guidance Estimation for Volumetric Tumour Segmentation

El artículo presenta LinGuinE, un marco de trabajo en PyTorch que combina registro de imágenes y segmentación guiada para lograr un seguimiento de lesiones y una segmentación volumétrica precisa en estudios longitudinales de tumores a partir de una sola indicación del radiólogo, sin necesidad de entrenamiento en datos longitudinales y logrando un rendimiento superior al estado del arte.

Nadine Garibli, Mayank Patwari, Bence Csiba + 2 more2026-02-27⚡ eess

Human-Guided Shade Artifact Suppression in CBCT-to-MDCT Translation via Schrödinger Bridge with Conditional Diffusion

Este trabajo presenta un marco novedoso basado en el Puente de Schrödinger y difusión condicional guiada por retroalimentación humana binaria para la traducción de imágenes CBCT a MDCT, que elimina eficazmente los artefactos de sombreado preservando la fidelidad anatómica y superando a los métodos anteriores con solo 10 pasos de muestreo.

Sung Ho Kang, Hyun-Cheol Park2026-02-27💻 cs

Is Exchangeability better than I.I.D to handle Data Distribution Shifts while Pooling Data for Data-scarce Medical image segmentation?

Este trabajo aborda el desafío de la escasez de datos en la segmentación de imágenes médicas proponiendo un marco basado en la intercambiabilidad en lugar de la independencia e identidad distribuida (i.i.d.), el cual controla las discrepancias de características entre fondos y primeros planos para mitigar los desplazamientos de distribución y lograr un rendimiento superior al estado del arte en múltiples conjuntos de datos.

Ayush Roy, Samin Enam, Jun Xia + 2 more2026-02-27🤖 cs.LG

LayerT2V: A Unified Multi-Layer Video Generation Framework

El artículo presenta LayerT2V, un marco unificado de generación de video que, aprovechando la compresión de los modelos actuales y un nuevo conjunto de datos llamado VidLayer, produce en una sola inferencia videos completos junto con sus capas de fondo y primer plano correspondientes, garantizando una coherencia semántica y temporal superior para flujos de trabajo profesionales.

Guangzhao Li, Kangrui Cen, Baixuan Zhao + 5 more2026-02-27🤖 cs.AI

Loc2^2: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching

El artículo presenta Loc2^2, un método interpretable y preciso para la localización cruzada de vistas que estima la pose de una imagen terrestre mediante el emparejamiento de características locales con una referencia aérea, elevando los puntos coincidentes a espacio BEV usando profundidad monocular y alineación Procrustes sin necesidad de anotaciones a nivel de píxel.

Zimin Xia, Chenghao Xu, Alexandre Alahi2026-02-27💻 cs

ST-GS: Vision-Based 3D Semantic Occupancy Prediction with Spatial-Temporal Gaussian Splatting

Este artículo presenta ST-GS, un marco innovador que mejora la predicción de ocupación semántica 3D mediante un mecanismo de atención dual para la agregación espacial y un esquema de fusión temporal consciente de la geometría, logrando así un rendimiento superior y mayor consistencia temporal en comparación con los métodos basados en Gaussianas existentes.

Xiaoyang Yan, Muleilan Pei, Shaojie Shen2026-02-27💻 cs

PartSAM: A Scalable Promptable Part Segmentation Model Trained on Native 3D Data

El artículo presenta PartSAM, el primer modelo de segmentación de partes 3D entrenado nativamente en grandes volúmenes de datos 3D mediante una arquitectura escalable y un pipeline de anotación masiva, lo que le permite superar a los métodos actuales en la identificación precisa de partes superficiales e internas de objetos sin depender de la transferencia de modelos 2D.

Zhe Zhu, Le Wan, Rui Xu + 6 more2026-02-27💻 cs

Detection and Measurement of Hailstones with Multimodal Large Language Models

Este estudio demuestra que los modelos de lenguaje grandes multimodales preentrenados pueden detectar y medir con precisión el diámetro de granizos en imágenes de redes sociales mediante estrategias de prompting de dos etapas, ofreciendo una alternativa complementaria a los sensores tradicionales para la evaluación rápida de eventos climáticos severos.

Moritz Alker, David C. Schedl, Andreas Stöckl2026-02-27🤖 cs.AI