Deep Learning-Based Meat Freshness Detection with Segmentation and OOD-Aware Classification

Este estudio presenta un marco de aprendizaje profundo que combina segmentación U-Net y clasificación con detección de datos fuera de distribución para evaluar la frescura de la carne en imágenes RGB, logrando una precisión del 98,10% con EfficientNet-B0 y validando su viabilidad de despliegue en dispositivos móviles mediante TensorFlow Lite.

Hutama Arif Bramantyo, Mukarram Ali Faridi, Rui Chen + 2 more2026-03-03⚡ eess

Unsupervised Semantic Segmentation in Synchrotron Computed Tomography with Self-Correcting Pseudo Labels

Este artículo presenta un marco no supervisado para la segmentación semática automática de grandes volúmenes de tomografía computarizada de sincrotrón que elimina la necesidad de anotación manual mediante la generación de etiquetas pseudo y su posterior refinamiento mediante un enfoque de "Unbiased Teacher" de auto-corrección, logrando mejoras significativas en la precisión y el mIoU.

Austin Yunker, Peter Kenesei, Hemant Sharma + 3 more2026-03-03💻 cs

PointAlign: Feature-Level Alignment Regularization for 3D Vision-Language Models

El artículo presenta PointAlign, un método de regularización de alineación a nivel de características que supervisa explícitamente los tokens intermedios de nubes de puntos para preservar la información geométrica y semántica en modelos de visión-linguística 3D, logrando mejoras significativas en tareas de clasificación y descripción sin requerir grandes cantidades de datos pareados ni un alto costo computacional.

Yuanhao Su, Shaofeng Zhang, Xiaosong Jia + 1 more2026-03-03💻 cs

LLM-Bootstrapped Targeted Finding Guidance for Factual MLLM-based Medical Report Generation

El artículo presenta Fact-Flow, un marco innovador que mejora la precisión factual en la generación de informes médicos mediante MLLM al separar la identificación de hallazgos visuales de la redacción del texto y utilizar un LLM para generar automáticamente datos de entrenamiento etiquetados, logrando así resultados superiores a los modelos actuales sin necesidad de anotación manual costosa.

Cunyuan Yang, Dejuan Song, Xiaotao Pang + 7 more2026-03-03💬 cs.CL

TAP-SLF: Parameter-Efficient Adaptation of Vision Foundation Models for Multi-Task Ultrasound Image Analysis

El artículo presenta TAP-SLF, un marco unificado y eficiente en parámetros que adapta modelos fundacionales de visión para el análisis multi-tarea de imágenes de ultrasonido mediante prompts suaves conscientes de la tarea y la fine-tuning selectiva de capas superiores, logrando así un alto rendimiento sin sobreajuste ni costos computacionales elevados.

Hui Wan, Libin Lan2026-03-03🤖 cs.AI

Improved Adversarial Diffusion Compression for Real-World Video Super-Resolution

Los autores proponen un método mejorado de compresión adversarial de difusión para la superresolución de video en escenarios reales, que distila un modelo DiT pesado en una red eficiente con convoluciones temporales ligeras y un esquema de destilación adversarial de doble cabeza, logrando una reducción del 95% en parámetros y una aceleración de 8 veces sin sacrificar la calidad ni la consistencia temporal.

Bin Chen, Weiqi Li, Shijie Zhao + 4 more2026-03-03💻 cs

Explainable Continuous-Time Mask Refinement with Local Self-Similarity Priors for Medical Image Segmentation

El artículo presenta LSS-LTCNet, un marco de segmentación semántica explicable y eficiente para úlceras podales que combina descriptores de textura invariantes a la iluminación mediante similitud local con dinámicas neuronales de tiempo continuo para lograr un refinamiento preciso de los bordes y un alto rendimiento en entornos de salud móvil.

Rajdeep Chatterjee, Sudip Chakrabarty, Trishaani Acharjee2026-03-03💻 cs