Large-scale Photorealistic Outdoor 3D Scene Reconstruction from UAV Imagery Using Gaussian Splatting Techniques

Este estudio presenta una arquitectura integral que transforma flujos de video de drones en reconstrucciones 3D fotorrealistas de gran escala en tiempo real mediante la fusión de estimación de poses y la técnica de 3D Gaussian Splatting, logrando un rendimiento de renderizado superior y una latencia significativamente menor en comparación con los enfoques basados en NeRF.

Christos Maikos, Georgios Angelidis, Georgios Th. Papadopoulos2026-02-25💻 cs

MedCLIPSeg: Probabilistic Vision-Language Adaptation for Data-Efficient and Generalizable Medical Image Segmentation

MedCLIPSeg es un marco innovador que adapta modelos de visión-idioma como CLIP mediante atención cruzada probabilística y una pérdida de contraste suave para lograr una segmentación de imágenes médicas precisa, eficiente en datos y generalizable, proporcionando además mapas de incertidumbre interpretables.

Taha Koleilat, Hojat Asgariandehkordi, Omid Nejati Manzari + 3 more2026-02-25💬 cs.CL

SceMoS: Scene-Aware 3D Human Motion Synthesis by Planning with Geometry-Grounded Tokens

El artículo presenta SceMoS, un marco de síntesis de movimiento humano 3D consciente de la escena que logra un estado del arte en realismo y precisión de contacto mediante la descomposición de la planificación global y la ejecución local utilizando representaciones 2D eficientes (imágenes de vista cenital y mapas de altitud) en lugar de costosos datos 3D volumétricos.

Anindita Ghosh, Vladislav Golyanik, Taku Komura + 3 more2026-02-25💻 cs

Pip-Stereo: Progressive Iterations Pruner for Iterative Optimization based Stereo Matching

El artículo presenta Pip-Stereo, un método de coincidencia estéreo que logra un rendimiento en tiempo real y alta precisión en hardware de borde mediante una poda progresiva de iteraciones, una transferencia de priores monoculares colaborativa y un operador FlashGRU optimizado, superando a los métodos existentes en velocidad y eficiencia sin sacrificar la exactitud.

Jintu Zheng, Qizhe Liu, HuangXin Xu + 1 more2026-02-25💻 cs

Beyond Human Performance: A Vision-Language Multi-Agent Approach for Quality Control in Pharmaceutical Manufacturing

Este artículo presenta un sistema de control de calidad automatizado para la industria farmacéutica que combina modelos de aprendizaje profundo y agentes de visión-lingüística para detectar colonias bacterianas con una precisión superior al 99%, reduciendo la verificación humana en un 85% y ofreciendo una solución escalable y regulada que supera las limitaciones de los métodos tradicionales.

Subhra Jyoti Mandal, Lara Rachidi, Puneet Jain + 2 more2026-02-25💻 cs