DC-Merge: Improving Model Merging with Directional Consistency
O artigo propõe o DC-Merge, um método de fusão de modelos que melhora a retenção de conhecimento ao equilibrar a distribuição de energia dos vetores de tarefa e alinhar suas geometrias direcionais em um subespaço ortogonal compartilhado, alcançando desempenho superior em benchmarks de visão e visão-linguagem.