MobileFetalCLIP: Selective Repulsive Knowledge Distillation for Mobile Fetal Ultrasound Analysis

El artículo presenta MobileFetalCLIP, un modelo de aprendizaje profundo ligero que utiliza una nueva técnica de destilación de conocimiento repulsivo selectivo para superar las limitaciones de capacidad de los modelos fundacionales, logrando un rendimiento superior en el análisis de ultrasonidos fetales en dispositivos móviles de bajo costo.

Numan Saeed, Fadillah Adamsyah Maani, Mohammad Yaqub2026-03-06🤖 cs.AI

Beyond Scattered Acceptance: Fast and Coherent Inference for DLMs via Longest Stable Prefixes

Este artículo presenta el programador Longest Stable Prefix (LSP), un método de inferencia sin entrenamiento que acelera hasta 3,4 veces la generación de texto en Modelos de Lenguaje de Difusión al reemplazar la aceptación fragmentada de tokens por la absorción monolítica de prefijos estables, optimizando así la localidad de la memoria y reduciendo los llamados al modelo sin comprometer la calidad.

Pengxiang Li, Joey Tsai, Hongwei Xue + 2 more2026-03-06💻 cs

EdgeDAM: Real-time Object Tracking for Mobile Devices

El artículo presenta EdgeDAM, un marco de seguimiento de objetos ligero y en tiempo real para dispositivos móviles que mejora la robustez ante oclusiones y distractores mediante una memoria de distractor consciente de doble búfer y un mecanismo de estabilización de caja retenida, logrando un alto rendimiento en benchmarks como DiDi y en hardware como el iPhone 15.

Syed Muhammad Raza, Syed Murtaza Hussain Abidi, Khawar Islam + 2 more2026-03-06💻 cs

Towards 3D Scene Understanding of Gas Plumes in LWIR Hyperspectral Images Using Neural Radiance Fields

Este artículo propone un método basado en Campos Neuronales de Radiación (NeRF) que, utilizando imágenes hiperespectrales de infrarrojo de onda larga (LWIR) y una pérdida MSE adaptativa ponderada, logra reconstruir escenas 3D con menos imágenes de entrenamiento y permite la detección efectiva de plumas de gas mediante renderizado de nuevas vistas.

Scout Jarman, Zigfried Hampel-Arias, Adra Carr + 1 more2026-03-06💻 cs

Transformer-Based Inpainting for Real-Time 3D Streaming in Sparse Multi-Camera Setups

Este trabajo propone un método de inpainting basado en transformadores y consciente de múltiples vistas que, como etapa de post-procesamiento independiente de la representación, completa las texturas faltantes en transmisiones 3D en tiempo real de configuraciones de cámaras escasas, logrando un equilibrio superior entre calidad visual y velocidad de inferencia en comparación con las técnicas existentes.

Leif Van Holland, Domenic Zingsheim, Mana Takhsha + 4 more2026-03-06💻 cs