Jordan-RoPE: Non-Semisimple Relative Positional Encoding via Complex Jordan Blocks
Dieser Beitrag stellt Jordan-RoPE vor, eine nicht halbeinfache relative Positionscodierung, die komplexe Jordan-Blöcke nutzt, um oszillierend-polynomiale Merkmale zur Modellierung von abstandsmodulierten Phasenwechselwirkungen zu erzeugen und in bestimmten Kontexten strukturelle Vorteile sowie spezifische Leistungsgewinne gegenüber den Standardbaselines RoPE und ALiBi aufweist.