ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging
Dit paper introduceert ZACH-ViT, een compacte Vision Transformer zonder positiële embeddings of [CLS]-token die door het verwijderen van vaste ruimtelijke prioren een adaptieve inductieve bias biedt die onder data-scarce omstandigheden in de medische beeldvorming superieure prestaties levert op datasets met zwakke ruimtelijke structuren.