LLM-based vs. Search-based Merge Conflict Resolution: An Empirical Study of Competing Paradigms

Este estudo empírico compara ferramentas de resolução de conflitos de mesclagem baseadas em LLM e baseadas em busca, revelando que, embora os LLMs se destaquem com conteúdo desequilibrado, os métodos baseados em busca oferecem robustez e generalização superiores, sugerindo, em última análise, que sistemas híbridos que combinam ambos os paradigmas são necessários para um desempenho ótimo.

Autores originais: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta

Publicado 2026-05-19✓ Author reviewed
📖 5 min de leitura🧠 Leitura aprofundada

Autores originais: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta

Artigo original sob licença CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta é uma explicação gerada por IA do artigo abaixo. Não foi escrita pelos autores. Para precisão técnica, consulte o artigo original. Ler aviso legal completo

Imagine que você e um amigo estão editando o mesmo documento ao mesmo tempo. Ambos fazem alterações no mesmo parágrafo e, quando tentam combinar o trabalho, o computador levanta as mãos e diz: "Não sei qual versão manter!" Isso é chamado de conflito de mesclagem.

Por décadas, os desenvolvedores tiveram que corrigir manualmente esses conflitos, o que é tedioso e propenso a erros. Recentemente, dois novos "ajudantes inteligentes" surgiram para resolver esse problema automaticamente. Este artigo é uma corrida cara a cara entre esses dois ajudantes para ver qual é melhor.

Os Dois Concorrentes

Pense nos dois ajudantes como tendo personalidades e conjuntos de habilidades muito diferentes:

1. O "Super-Leitor" (abordagem baseada em LLM, representada pelo MergeGen)

  • Como funciona: Este ajudante é como um aluno brilhante que leu milhões de livros e documentos de código. Ele não realmente "calcula" a resposta; em vez disso, usa sua memória de como as coisas geralmente se parecem para adivinhar a melhor solução. Ele prevê a próxima palavra ou linha com base em padrões que aprendeu.
  • A Analogia: É como um chef que provou milhares de sopas. Se você der a ele uma receita com um ingrediente faltando, ele não mede as especiarias; ele apenas "sabe" como a sopa deve saber com base na experiência e adiciona a quantidade certa.

2. O "Resolvedor de Quebra-Cabeças" (abordagem baseada em busca, representada pelo SBCR)

  • Como funciona: Este ajudante é um engenheiro metódico. Ele não sabe o que o código significa; ele apenas vê linhas de texto. Ele trata o conflito como um quebra-cabeças gigante. Ele tenta milhões de combinações diferentes das linhas existentes, verificando cada uma para ver qual mistura se parece mais com as versões originais. Ele usa uma regra simples: "A melhor solução geralmente é uma mistura que se parece de alguma forma com ambos os pais."
  • A Analogia: É como um detetive que não faz ideia de quem é o suspeito, então tenta todas as combinações possíveis de álibis e pistas até encontrar a que se encaixa perfeitamente nos fatos. Ele não adivinha; ele testa.

A Corrida: O Que Aconteceu?

Os pesquisadores colocaram esses dois contra milhares de conflitos do mundo real de projetos de código aberto (como código Java, C# e JavaScript). Aqui está o que eles descobriram:

1. O "Super-Leitor" vence quando as coisas estão bagunçadas.
Quando as duas versões do código eram muito diferentes em tamanho (por exemplo, uma versão adicionou um parágrafo enorme enquanto a outra apagou uma única linha), o Super-Leitor foi incrível. Como aprendeu com tantos dados, ele conseguia entender o contexto e escolher as linhas certas, mesmo que o equilíbrio fosse estranho. Também foi muito mais rápido, resolvendo conflitos num piscar de olhos.

2. O "Resolvedor de Quebra-Cabeças" vence quando as coisas estão equilibradas.
Quando as duas versões eram semelhantes em tamanho e estrutura, o Resolvedor de Quebra-Cabeças foi o campeão. Ele encontrou a mistura perfeita de linhas com mais frequência do que o Super-Leitor. Também foi mais confiável quando o código continha símbolos estranhos, texto não em inglês ou era extremamente longo.

3. O "Super-Leitor" tem alguns maus hábitos.

  • Vazamentos de Memória: Às vezes, o Super-Leitor ficava "preso" em um exemplo específico que havia visto antes em seu treinamento. Ele apenas repetiria aquela resposta, mesmo que estivesse errada para a situação atual. Isso é chamado de sobreajuste — ele memorizou o teste em vez de aprender a lição.
  • Pouca Atenção: Se o bloco de código fosse grande demais, o Super-Leitor ficaria sobrecarregado e pararia de escrever pela metade, deixando o conflito meio resolvido.
  • Barreira de Idioma: Se o código tivesse comentários em um idioma em que o modelo não foi treinado, ele ficava confuso.

4. O "Resolvedor de Quebra-Cabeças" é um pouco lento, mas constante.
Leva mais tempo para resolver o quebra-cabeça porque precisa testar muitas combinações. No entanto, ele nunca fica confuso com texto longo ou idiomas estranhos porque trata tudo como texto simples. Ele não "memoriza" nada, então não sofre de sobreajuste.

A Grande Conclusão: Não Há "Bala de Prata"

O artigo conclui que nenhum ajudante é perfeito por si só.

  • Se você der ao Super-Leitor um conflito pequeno e bagunçado, ele é um gênio.
  • Se você der ao Resolvedor de Quebra-Cabeças um conflito enorme, equilibrado ou com formatação estranha, ele é o cavalo de trabalho confiável.

A Solução?
Os autores sugerem construir um sistema híbrido — um "Policial de Trânsito" que analisa o conflito primeiro.

  • Se o conflito for pequeno e bagunçado, o Policial de Trânsito o envia para o Super-Leitor.
  • Se o conflito for enorme, equilibrado ou contiver caracteres estranhos, o Policial de Trânsito o envia para o Resolvedor de Quebra-Cabeças.

Ao deixar a ferramenta certa fazer o trabalho certo, podemos criar um sistema que seja tanto rápido quanto preciso, poupando os desenvolvedores da dor de cabeça da mesclagem manual.

Resumo em Uma Frase

Este artigo prova que, embora os "adivinhadores" de IA sejam rápidos e ótimos para problemas bagunçados, os "buscadores" são mais confiáveis para problemas complexos ou estranhos, e a melhor ferramenta futura será uma combinação inteligente de ambos.

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →