Face Pyramid Vision Transformer
Die Arbeit stellt das Face Pyramid Vision Transformer (FPVT) vor, ein neuartiges Modell, das durch die Kombination von CNN-Eigenschaften mit Vision-Transformern und speziellen Reduktionsmechanismen eine kompakte, hochleistungsfähige Gesichtserkennung mit weniger Parametern als bestehende State-of-the-Art-Methoden ermöglicht.