What DINO saw: ALiBi positional encoding reduces positional bias in Vision Transformers
Este trabalho investiga e reduz o viés posicional em Vision Transformers, demonstrando que o ajuste fino com codificação posicional relativa ALiBi preserva a semântica geral enquanto permite a adaptação eficaz para tarefas como a segmentação de imagens de microscopia sem direção preferencial.