Evaluating Graphical Perception Capabilities of Vision Transformers
Diese Studie untersucht die graphische Wahrnehmungsfähigkeit von Vision Transformern im Vergleich zu CNNs und Menschen und stellt fest, dass ViTs trotz ihrer allgemeinen Stärken in der Bildverarbeitung nur eine begrenzte menschähnliche Wahrnehmung im Bereich der Visualisierung aufweisen.