Location-Aware Pretraining for Medical Difference Visual Question Answering
Este trabajo presenta un marco de preentrenamiento con tareas conscientes de la ubicación que mejora la capacidad de los modelos de visión para detectar cambios clínicos sutiles en imágenes médicas, logrando un rendimiento superior en la respuesta a preguntas visuales sobre diferencias en radiografías de tórax.