Motion Prior Distillation in Time Reversal Sampling for Generative Inbetweening

Este trabajo propone la destilación de priores de movimiento (MPD), una técnica de inferencia que mejora la coherencia temporal en la generación de fotogramas intermedios al transferir el residual de movimiento de la trayectoria hacia adelante a la hacia atrás, evitando así las discontinuidades y artefactos visuales causados por la desalineación en los modelos de difusión de imagen a video.

Wooseok Jeon, Seunghyun Shin, Dongmin Shin + 1 more2026-02-20💻 cs

CT-Bench: A Benchmark for Multimodal Lesion Understanding in Computed Tomography

El artículo presenta CT-Bench, un nuevo conjunto de datos y evaluación de referencia pionero que aborda la escasez de anotaciones a nivel de lesión en tomografía computarizada mediante un extenso conjunto de imágenes con metadatos y un banco de preguntas y respuestas visuales, demostrando que el ajuste fino de modelos multimodales en estos datos mejora significativamente el análisis de lesiones en comparación con las evaluaciones de radiólogos.

Qingqing Zhu, Qiao Jin, Tejas S. Mathai + 10 more2026-02-20🤖 cs.AI

Intracoronary Optical Coherence Tomography Image Processing and Vessel Classification Using Machine Learning

Este artículo presenta un pipeline automatizado que utiliza técnicas de aprendizaje automático, como la extracción de características y clasificadores SVM y regresión logística, para lograr una segmentación y clasificación precisa de vasos sanguíneos en imágenes de tomografía de coherencia óptica intracoronaria con una precisión del 99,68%.

Amal Lahchim, Lambros Athanasiou2026-02-20🤖 cs.AI

Three-dimensional Damage Visualization of Civil Structures via Gaussian Splatting-enabled Digital Twins

Este estudio presenta un método de gemelo digital habilitado por Splatting Gaussiano que supera las limitaciones de las técnicas tradicionales para visualizar daños en estructuras civiles en 3D, ofreciendo una reconstrucción eficiente, detallada y actualizable mediante una estrategia multiescala probada en un conjunto de datos sintético de post-sismo.

Shuo Wang, Shuo Wang, Xin Nie + 3 more2026-02-20💻 cs

Analytic Score Optimization for Multi Dimension Video Quality Assessment

Este artículo presenta UltraVQA, un dataset a gran escala de contenido generado por usuarios con anotaciones multidimensionales, e introduce la Optimización de Puntuación Analítica (ASO), un método de post-entrenamiento teóricamente fundamentado que supera a los modelos existentes al mejorar la precisión y la alineación con las preferencias humanas en la evaluación de calidad de video.

Boda Lin, Yongjie Zhu, Wenyu Qin + 2 more2026-02-20💻 cs

StereoAdapter-2: Globally Structure-Consistent Underwater Stereo Depth Estimation

Este artículo presenta StereoAdapter-2, un marco de estimación de profundidad estéreo para entornos submarinos que reemplaza las actualizaciones convencionales basadas en GRU con un operador ConvSS2D de modelos de estado selectivo para lograr una propagación espacial eficiente de largo alcance, y que se complementa con la creación del dataset sintético UW-StereoDepth-80K, logrando un rendimiento de vanguardia en pruebas cero-shot y validación en plataformas reales.

Zeyu Ren, Xiang Li, Yiran Wang + 2 more2026-02-20💻 cs

Xray-Visual Models: Scaling Vision models on Industry Scale Data

Xray-Visual es un modelo unificado de visión entrenado a escala industrial con datos de redes sociales que, mediante una arquitectura eficiente y un pipeline de entrenamiento de tres etapas, logra un rendimiento superior en clasificación de imágenes, comprensión de video y recuperación multimodal, mejorado aún más mediante la integración de modelos de lenguaje grandes.

Shlok Mishra, Tsung-Yu Lin, Linda Wang + 23 more2026-02-20🤖 cs.AI

HS-3D-NeRF: 3D Surface and Hyperspectral Reconstruction From Stationary Hyperspectral Images Using Multi-Channel NeRFs

Este artículo presenta HSI-SC-NeRF, un marco de redes neuronales de campos radiantes (NeRF) de múltiples canales diseñado para la reconstrucción 3D y espectral de productos agrícolas mediante una cámara estacionaria y un objeto rotatorio, superando las limitaciones de hardware de los sistemas tradicionales para su integración en flujos de trabajo automatizados de inspección postcosecha.

Kibon Ku, Talukder Z. Jubery, Adarsh Krishnamurthy + 1 more2026-02-20💻 cs