What DINO saw: ALiBi positional encoding reduces positional bias in Vision Transformers
Este trabajo demuestra que el ajuste fino de Vision Transformers con codificación posicional ALiBi reduce significativamente los sesgos posicionales, preservando al mismo tiempo las semánticas generales y permitiendo una segmentación efectiva en imágenes de microscopía complejas.