Feature Resemblance: On the Theoretical Understanding of Analogical Reasoning in Transformers
Este artigo demonstra teoricamente e experimentalmente que o raciocínio analógico em transformadores emerge da aprendizagem de representações alinhadas para entidades com propriedades semelhantes, sendo facilitado por um currículo de treinamento específico e pela presença explícita de pontes de identidade nos dados.