Jordan-RoPE: Non-Semisimple Relative Positional Encoding via Complex Jordan Blocks
Este artigo apresenta o Jordan-RoPE, uma codificação posicional relativa não semissimples que aproveita blocos de Jordan complexos para gerar características oscilatórias e polinomiais para modelar interações de fase moduladas por distância, demonstrando vantagens estruturais e ganhos de desempenho específicos em relação às bases padrão RoPE e ALiBi em certos contextos.