BayesFusion-SDF: Probabilistic Signed Distance Fusion with View Planning on CPU

El artículo presenta BayesFusion-SDF, un marco de fusión probabilística de distancia firmada centrado en la CPU que supera a los métodos tradicionales TSDF y las redes neuronales intensivas en GPU al ofrecer una reconstrucción geométrica precisa con estimaciones de incertidumbre transparentes para la planificación de vistas y la percepción activa.

Soumya Mazumdar, Vineet Kumar Rakesh, Tapas Samanta2026-02-24💻 cs

Iconographic Classification and Content-Based Recommendation for Digitized Artworks

Este artículo presenta un sistema prototipo que automatiza la clasificación iconográfica y la recomendación basada en contenido de obras de arte digitalizadas mediante la integración de la detección de objetos YOLOv8, el vocabulario Iconclass y algoritmos de inferencia, demostrando su potencial para acelerar la catalogación y mejorar la navegación en grandes repositorios de patrimonio cultural.

Krzysztof Kutt, Maciej Baczyński2026-02-24🤖 cs.AI

Pixels Don't Lie (But Your Detector Might): Bootstrapping MLLM-as-a-Judge for Trustworthy Deepfake Detection and Reasoning Supervision

El artículo presenta DeepfakeJudge, un marco que utiliza un proceso de autoevaluación con modelos de lenguaje multimodal para supervisar y evaluar la fidelidad del razonamiento en la detección de deepfakes, logrando una alta precisión y concordancia con juicios humanos sin depender de explicaciones de referencia explícitas.

Kartik Kuckreja, Parul Gupta, Muhammad Haris Khan + 1 more2026-02-24💻 cs

Towards Personalized Multi-Modal MRI Synthesis across Heterogeneous Datasets

El artículo presenta PMM-Synth, un marco de síntesis de resonancia magnética (MRI) multimodal personalizado que, mediante módulos de modulación de características, programación de lotes y pérdida de supervisión selectiva, logra una generalización efectiva entre conjuntos de datos heterogéneos para superar las limitaciones de los métodos actuales y mejorar el diagnóstico clínico en escenarios con modalidades faltantes.

Yue Zhang, Zhizheng Zhuo, Siyao Xu + 6 more2026-02-24💻 cs

VGGT-MPR: VGGT-Enhanced Multimodal Place Recognition in Autonomous Driving Environments

El artículo presenta VGGT-MPR, un marco de reconocimiento de lugares multimodal para la conducción autónoma que utiliza el Transformer VGGT como motor geométrico unificado para extraer características visuales enriquecidas y densificar nubes de puntos LiDAR en la recuperación global, además de emplear un mecanismo de reordenamiento sin entrenamiento basado en el seguimiento de puntos clave para lograr un rendimiento superior y robusto frente a cambios ambientales.

Jingyi Xu, Zhangshuo Qi, Zhongmiao Yan + 5 more2026-02-24💻 cs

RAP: Fast Feedforward Rendering-Free Attribute-Guided Primitive Importance Score Prediction for Efficient 3D Gaussian Splatting Processing

El artículo presenta RAP, un método rápido y sin renderizado que predice la importancia de los primitivos en la Splatting Gaussiana 3D utilizando atributos intrínsecos y estadísticas vecinas, permitiendo una eliminación de redundancia eficiente y una generalización robusta sin depender de análisis basados en vistas múltiples.

Kaifa Yang, Qi Yang, Yiling Xu + 1 more2026-02-24💻 cs

Training Deep Stereo Matching Networks on Tree Branch Imagery: A Benchmark Study for Real-Time UAV Forestry Applications

Este estudio presenta la primera evaluación de diez redes de correspondencia estereoscópica profunda entrenadas con el conjunto de datos Canterbury Tree Branches para aplicaciones de poda de árboles en drones, identificando a BANet-3D como la mejor opción en calidad de imagen y a AnyNet como la única capaz de alcanzar un rendimiento cercano al tiempo real en hardware embebido.

Yida Lin, Bing Xue, Mengjie Zhang + 2 more2026-02-24⚡ eess

Efficient endometrial carcinoma screening via cross-modal synthesis and gradient distillation

Este estudio presenta un marco de aprendizaje profundo eficiente y automatizado que combina la síntesis de imágenes de ultrasonido a partir de resonancia magnética mediante una red guiada por estructura y la destilación de gradientes para un cribado de carcinoma endometrial con alta precisión y bajo costo computacional, superando la capacidad diagnóstica de los ecografistas expertos en entornos de atención primaria con recursos limitados.

Dongjing Shan, Yamei Luo, Jiqing Xuan + 7 more2026-02-24🤖 cs.AI

M3S-Net: Multimodal Feature Fusion Network Based on Multi-scale Data for Ultra-short-term PV Power Forecasting

Este artículo presenta M3S-Net, una red neuronal multimodal innovadora que integra convoluciones parciales de múltiples escalas, transformadas de Fourier y un módulo de interacción Mamba dinámico para mejorar la precisión de la predicción de potencia fotovoltaica a muy corto plazo mediante una fusión profunda de características visuales y meteorológicas.

Penghui Niu, Taotao Cai, Suqi Zhang + 4 more2026-02-24💻 cs

DerMAE: Improving skin lesion classification through conditioned latent diffusion and MAE distillation

DerMAE mejora la clasificación de lesiones cutáneas en entornos clínicos al generar imágenes sintéticas mediante modelos de difusión condicionados por clase, preentrenar grandes modelos ViT con MAE para extraer características robustas y transferir ese conocimiento a modelos ligeros mediante destilación, logrando así un alto rendimiento en dispositivos móviles a pesar del desequilibrio de clases.

Francisco Filho, Kelvin Cunha, Fábio Papais + 6 more2026-02-24💻 cs