Reducing Cost of LLM Agents with Trajectory Reduction

Este artículo presenta AgentDiet, un enfoque de reducción de trayectorias en tiempo de inferencia que elimina información redundante en agentes de LLM para software, logrando una reducción significativa de costos computacionales y de tokens sin comprometer el rendimiento.

Yuan-An Xiao, Pengfei Gao, Chao Peng, Yingfei Xiong

Publicado 2026-03-17
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que un Agente de IA (como un asistente virtual muy inteligente) es como un detective que está resolviendo un caso complejo, por ejemplo, arreglar un error en un programa de computadora.

El Problema: La Mochila que se Hace Pesada

Imagina que este detective va investigando paso a paso. Cada vez que hace una pregunta, busca un archivo o ejecuta una orden, escribe todo lo que pasa en su cuaderno de notas (esto se llama "trayectoria").

El problema es que, a medida que el caso avanza, el detective nunca borra nada de su cuaderno.

  • Si abre un archivo gigante, lo copia entero.
  • Si ejecuta una prueba y salen 100 resultados, copia los 100, aunque solo le importe uno.
  • Si busca algo en 50 archivos y solo encuentra el correcto en el último, sigue guardando los 49 que no sirvieron.

Con el tiempo, este cuaderno se vuelve enorme. Cada vez que el detective quiere pensar en el siguiente paso, tiene que leer todo el cuaderno desde la primera página hasta la última. Esto es como intentar correr una maratón cargando una mochila que se llena de piedras a medida que avanzas.

  • Consecuencia: Se gasta muchísima energía (dinero y tiempo de computación) y el detective se vuelve más lento y torpe porque está abrumado por tanta información basura.

La Solución: "AgentDiet" (La Dieta del Agente)

Los autores de este paper crearon una solución llamada AgentDiet. Imagina que, en lugar de dejar que el detective cargue con todo, tenemos un asistente de limpieza (un segundo cerebro más rápido y barato) que revisa el cuaderno periódicamente.

Este asistente hace tres cosas mágicas:

  1. Elimina lo inútil: Borra las listas de archivos que no se usaron o los mensajes de error que ya no importan.
  2. Resum lo repetitivo: Si el detective escribió lo mismo tres veces, lo deja escrito una sola vez.
  3. Olvida lo viejo: Si el detective ya encontró el archivo correcto, borra la información de los 49 archivos que revisó antes y que no sirvieron.

La analogía clave: Es como si, en lugar de llevar todo el historial de una conversación de WhatsApp de 5 años para decidir qué decir hoy, solo guardaras los mensajes importantes de las últimas horas y resumieras el resto en una nota: "Hablamos de comida, luego de trabajo, y luego de fútbol".

¿Cómo funciona en la vida real?

El sistema funciona así:

  1. El Detective Principal (el modelo de IA potente) trabaja en el problema.
  2. Cada cierto tiempo, el sistema le dice al Asistente de Limpieza (un modelo de IA más barato y rápido): "Oye, revisa lo que escribimos hace un momento. ¿Hay algo que podamos tirar o resumir?".
  3. El Asistente de Limpieza hace el trabajo sucio, borra la "basura" y devuelve un cuaderno más limpio.
  4. El Detective Principal sigue trabajando, pero ahora con un cuaderno más ligero y fácil de leer.

Los Resultados: ¡Más rápido y más barato!

Los autores probaron esto con agentes que arreglan errores de código reales. Los resultados fueron increíbles:

  • Ahorro de espacio: Eliminaron entre un 40% y un 60% de la información innecesaria.
  • Ahorro de dinero: Redujeron el costo de computación en un 21% al 36%.
  • Calidad: Lo más importante es que el detective no cometió más errores. De hecho, al tener menos "ruido" en su mente, a veces resolvió los problemas incluso mejor o más rápido.

En resumen

Este paper nos enseña que no necesitamos leer todo para entenderlo. En el mundo de la Inteligencia Artificial, a veces "menos es más". Al limpiar la basura de la memoria de los agentes, podemos hacerlos más rápidos, más baratos y más eficientes, sin sacrificar su inteligencia.

Es como pasar de llevar una casa entera en la espalda a llevar solo lo esencial en un bolsillo: llegas más lejos, más rápido y con menos esfuerzo.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →