Face Pyramid Vision Transformer
El artículo presenta la Face Pyramid Vision Transformer (FPVT), un modelo innovador que combina mecanismos de atención espacial, reducción de dimensionalidad y componentes convolucionales para lograr un rendimiento superior en reconocimiento facial con menos parámetros que los métodos existentes.