LLM-based vs. Search-based Merge Conflict Resolution: An Empirical Study of Competing Paradigms

Este estudio empírico compara las herramientas de resolución de conflictos de fusión basadas en LLM y las basadas en búsqueda, revelando que, aunque las LLM sobresalen con contenido desequilibrado, los métodos basados en búsqueda ofrecen una robustez y generalización superiores, sugiriendo en última instancia que los sistemas híbridos que combinan ambos paradigmas son necesarios para un rendimiento óptimo.

Autores originales: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta

Publicado 2026-05-19✓ Author reviewed
📖 5 min de lectura🧠 Análisis profundo

Autores originales: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que tú y un amigo están editando el mismo documento al mismo tiempo. Ambos hacéis cambios en el mismo párrafo y, cuando intentáis combinar vuestro trabajo, el ordenador levanta los brazos y dice: "¡No sé qué versión conservar!". Esto se llama un conflicto de fusión.

Durante décadas, los desarrolladores han tenido que corregir manualmente estos conflictos, lo cual es tedioso y propenso a errores. Recientemente, han surgido dos nuevos "ayudantes inteligentes" para resolver este problema automáticamente. Este artículo es una carrera cara a cara entre estos dos ayudantes para ver cuál es mejor.

Los dos contendientes

Imagina que los dos ayudantes tienen personalidades y conjuntos de habilidades muy diferentes:

1. El "Super-Lector" (enfoque basado en LLM, representado por MergeGen)

  • Cómo funciona: Este ayudante es como un estudiante brillante que ha leído millones de libros y documentos de código. No realmente "calcula" la respuesta; en su lugar, utiliza su memoria de cómo las cosas suelen parecer para adivinar la mejor solución. Predice la siguiente palabra o línea basándose en patrones que ha aprendido.
  • La analogía: Es como un chef que ha probado miles de sopas. Si le das una receta con un ingrediente faltante, no mide las especias; simplemente "sabe" cómo debería saber la sopa basándose en la experiencia y añade la cantidad correcta.

2. El "Resolutor de Puzzles" (enfoque basado en búsqueda, representado por SBCR)

  • Cómo funciona: Este ayudante es un ingeniero metódico. No sabe lo que el código significa; solo ve líneas de texto. Trata el conflicto como un rompecabezas gigante. Prueba millones de combinaciones diferentes de las líneas existentes, verificando cada una para ver qué mezcla se parece más a las versiones originales. Utiliza una regla simple: "La mejor solución suele ser una mezcla que se parezca algo a ambos padres".
  • La analogía: Es como un detective que no tiene idea de quién es el sospechoso, así que prueba cada combinación posible de coartadas y pistas hasta encontrar la que encaja perfectamente con los hechos. No adivina; prueba.

La carrera: ¿Qué pasó?

Los investigadores enfrentaron a estos dos contra miles de conflictos del mundo real procedentes de proyectos de código abierto (como código en Java, C# y JavaScript). Esto es lo que descubrieron:

1. El "Super-Lector" gana cuando las cosas están desordenadas.
Cuando las dos versiones del código eran muy diferentes en tamaño (por ejemplo, una versión añadía un párrafo enorme mientras que la otra eliminaba una sola línea), el Super-Lector era asombroso. Debido a que aprendió de tantos datos, podía entender el contexto y elegir las líneas correctas, incluso si el equilibrio era extraño. También era mucho más rápido, resolviendo conflictos en un abrir y cerrar de ojos.

2. El "Resolutor de Puzzles" gana cuando las cosas están equilibradas.
Cuando las dos versiones eran similares en tamaño y estructura, el Resolutor de Puzzles era el campeón. Encontraba la mezcla perfecta de líneas con más frecuencia que el Super-Lector. También era más fiable cuando el código contenía símbolos extraños, texto en idiomas no ingleses o era extremadamente largo.

3. El "Super-Lector" tiene algunos malos hábitos.

  • Fugas de memoria: A veces, el Super-Lector se "quedaba atascado" en un ejemplo específico que había visto antes en su entrenamiento. Simplemente repetía esa respuesta, incluso si era incorrecta para la situación actual. Esto se llama sobreajuste: memorizó el examen en lugar de aprender la lección.
  • Poca capacidad de atención: Si el fragmento de código era demasiado grande, el Super-Lector se abrumaba y dejaba de escribir a mitad de camino, dejando el conflicto a medias.
  • Barrera del idioma: Si el código tenía comentarios en un idioma en el que el modelo no había sido entrenado, se confundía.

4. El "Resolutor de Puzzles" es un poco lento pero constante.
Tarda más en resolver el puzzle porque tiene que probar muchas combinaciones. Sin embargo, nunca se confunde con texto largo o idiomas extraños porque trata todo como texto simple. No "memoriza" nada, por lo que no sufre sobreajuste.

La gran conclusión: No hay "bala de plata"

El artículo concluye que ningún ayudante es perfecto por sí solo.

  • Si le das al Super-Lector un conflicto pequeño y desordenado, es un genio.
  • Si le das al Resolutor de Puzzles un conflicto enorme, equilibrado o con formato extraño, es el caballo de trabajo fiable.

¿La solución?
Los autores sugieren construir un sistema híbrido: un "Policía de Tráfico" que examine el conflicto primero.

  • Si el conflicto es pequeño y desordenado, el Policía de Tráfico lo envía al Super-Lector.
  • Si el conflicto es enorme, equilibrado o contiene caracteres extraños, el Policía de Tráfico lo envía al Resolutor de Puzzles.

Al permitir que la herramienta correcta haga el trabajo correcto, podemos crear un sistema que sea tanto rápido como preciso, ahorrando a los desarrolladores el dolor de cabeza de la fusión manual.

Resumen en una frase

Este artículo demuestra que, aunque los "adivinos" de la IA son rápidos y excelentes para problemas desordenados, los "buscadores" son más fiables para problemas complejos o extraños, y la mejor herramienta futura será una combinación inteligente de ambos.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →