Geometry of Lightning Self-Attention: Identifiability and Dimension
Cet article emploie la géométrie algébrique pour analyser les espaces de fonctions des réseaux d'auto-attention non normalisés, établissant leur identifiabilité et leur dimension tout en caractérisant les points singuliers et en conjecturant ces résultats pour les architectures normalisées.