AMLRIS: Alignment-aware Masked Learning for Referring Image Segmentation
El artículo presenta AMLRIS, una estrategia de entrenamiento simple y efectiva que mejora la segmentación de imágenes referenciadas al enmascarar dinámicamente los píxeles con baja alineación entre visión y lenguaje, logrando así resultados de vanguardia sin modificar la arquitectura ni añadir sobrecarga en la inferencia.