MERLIN: Multi-Stage Curriculum Alignment for Multilingual Encoder-LLM Integration in Cross-Lingual Reasoning
O MERLIN é um novo framework de duas etapas que utiliza aprendizado curricular e a adaptação de um pequeno conjunto de pesos DoRA para integrar codificadores multilíngues com LLMs, superando significativamente os métodos existentes e o GPT-4o-mini em tarefas de raciocínio em línguas de baixo recurso, como demonstrado no benchmark AfriMGSM.