Scaling Machine Learning Interatomic Potentials with Mixtures of Experts
Este artigo apresenta o desenvolvimento e análise de arquiteturas de Mistura de Especialistas (MoE) e Mistura de Especialistas Lineares (MoLE) para Potenciais Interatômicos Baseados em Aprendizado de Máquina (MLIPs), demonstrando que o uso de ativação esparsa com especialistas compartilhados e roteamento elemento a elemento resulta em um modelo com precisão de última geração e especialização química interpretável.