Conventional Commit Classification using Large Language… — Explicación divulgativa

Autores originales: H. M. Sazzad Quadir, Sakib Al Hasan, Md. Nurul Ahad Tawhid

Publicado 2026-05-06✓ Author reviewed ⓘ

📖 4 min de lectura☕ Lectura para el café

Autores originales: H. M. Sazzad Quadir, Sakib Al Hasan, Md. Nurul Ahad Tawhid

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ✨ Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Imagina que eres el gerente de una biblioteca masiva y caótica donde se añaden miles de libros cada día. Para mantener las cosas organizadas, la biblioteca tiene una regla estricta: cada libro nuevo debe tener una etiqueta específica en su lomo (como "Nueva Función", "Corrección de Error" o "Documentación") para que los robots puedan clasificarlos automáticamente, actualizar el catálogo y decirle a los visitantes qué hay de nuevo.

Sin embargo, en la realidad, las personas que añaden los libros a menudo ignoran las reglas. Escriben notas desordenadas como "arreglé lo de allá" o "cambié algo del código", lo que hace imposible que los robots sepan a qué categoría pertenece el libro.

Este artículo trata sobre enseñar a un robot superinteligente (una IA) a leer esas notas desordenadas y determinar la etiqueta correcta, sin tener que pasar años estudiando miles de ejemplos primero.

El Problema: Notas Desordenadas vs. Reglas Estrictas

En el desarrollo de software, los programadores escriben "mensajes de confirmación" (notas) cada vez que guardan cambios en su código. La industria tiene un formato estándar llamado Conventional Commits que actúa como un sistema de archivo estricto. Requiere que las notas comiencen con una etiqueta específica (por ejemplo, feat:, fix:).

Pero los humanos son desordenados. A menudo olvidan las etiquetas. Tradicionalmente, para solucionar esto, los investigadores construían un robot personalizado alimentándolo con miles de ejemplos etiquetados (como un estudiante memorizando un libro de texto). Esto requiere mucho tiempo y datos.

El Nuevo Enfoque: La Estrategia de "Prompt"

En lugar de entrenar un robot nuevo desde cero, los autores se preguntaron: ¿Podemos simplemente darle a una IA muy inteligente y preexistente un conjunto de instrucciones (un "prompt") para que haga el trabajo?

Trataron a la IA como a un becario brillante que ya sabe mucho sobre el lenguaje pero necesita saber exactamente qué tarea realizar. Probaron tres formas diferentes de dar instrucciones:

Zero-Shot (El Enfoque "Solo Dímelo"):
- La Analogía: Te acercas al becario y dices: "Aquí hay una nota desordenada. Por favor, dime a qué categoría pertenece basándote en las reglas". No das ejemplos.
- Resultado: El becario adivina, pero a menudo se equivoca porque no sabe exactamente lo que quieres.
Few-Shot (El Enfoque "Muéstrame Ejemplos"):
- La Analogía: Dices: "Aquí hay una nota desordenada que significa 'Nueva Función'. Aquí hay otra que significa 'Corrección de Error'. Ahora, mira esta nueva nota desordenada y dime qué es". Primero muestras al becario algunos ejemplos claros.
- Resultado: Esto funcionó mejor. El becario entendió el patrón rápidamente y clasificó los libros con precisión.
Cadena de Pensamiento (El Enfoque "Piensa en Voz Alta"):
- La Analogía: Dices: "Antes de darme la respuesta, por favor escribe tu razonamiento paso a paso: 'Veo la palabra "arreglar", así que creo que es un error...'".
- Resultado: Sorprendentemente, esto no ayudó. Para esta tarea específica de clasificar etiquetas, hacer que el becario "piense en voz alta" solo añadió pasos extra sin mejorar la respuesta final. Fue como pedirle a un bibliotecario que escriba un ensayo antes de archivar un libro; los ralentizó sin mejorar el resultado.

Los Competidores: ¿Qué Tan Grande Necesita Ser el Cerebro?

Los investigadores probaron tres "becarios" (modelos de IA) diferentes de diversos tamaños:

Mistral-7B: Un cerebro de tamaño mediano (7 mil millones de parámetros).
LLaMA-3-8B: Un cerebro ligeramente más grande (8 mil millones de parámetros).
DeepSeek-R1-32B: Un cerebro gigante (32 mil millones de parámetros).

El Hallazgo: El cerebro más grande ganó. El DeepSeek-R1-32B fue el más preciso al leer las notas desordenadas y encontrar la etiqueta correcta. Esto sugiere que para este tipo de tarea, tener un modelo de IA más grande y potente marca una diferencia real.

La Conclusión

El artículo concluye que no necesitas construir un modelo de aprendizaje automático personalizado desde cero para organizar notas de software desordenadas. En su lugar, puedes usar una IA potente y preexistente y simplemente darle algunos buenos ejemplos (prompting Few-Shot) para que haga el trabajo.

Mejor Estrategia: Mostrarle a la IA algunos ejemplos primero.
Mejor IA: El modelo más grande y potente disponible.
Pérdida de Tiempo: Hacer que la IA escriba un largo proceso de razonamiento antes de responder.

Este enfoque ahorra tiempo y esfuerzo porque evita la necesidad de recopilar y etiquetar miles de ejemplos de entrenamiento, permitiendo a los desarrolladores automatizar su organización de archivos de inmediato.

Conventional Commit Classification using Large Language Models and Prompt Engineering

El Problema: Notas Desordenadas vs. Reglas Estrictas

El Nuevo Enfoque: La Estrategia de "Prompt"

Los Competidores: ¿Qué Tan Grande Necesita Ser el Cerebro?

La Conclusión

Resumen Técnico: Clasificación de Commits Convencionales utilizando Modelos de Lenguaje Grandes y Ingeniería de Prompts

Declaración del Problema

Metodología

Resultados Clave

Contribuciones Clave

Significado y Afirmaciones

Conventional Commit Classification using Large Language Models and Prompt Engineering

El Problema: Notas Desordenadas vs. Reglas Estrictas

El Nuevo Enfoque: La Estrategia de "Prompt"

Los Competidores: ¿Qué Tan Grande Necesita Ser el Cerebro?

La Conclusión

Resumen Técnico: Clasificación de Commits Convencionales utilizando Modelos de Lenguaje Grandes y Ingeniería de Prompts

Declaración del Problema

Metodología

Resultados Clave

Contribuciones Clave

Significado y Afirmaciones

Más como este