Ares: Adaptive Reasoning Effort Selection for Efficient LLM Agents

El artículo presenta Ares, un marco que utiliza un enrutador ligero para seleccionar dinámicamente el nivel de razonamiento óptimo en cada paso de las tareas de agentes LLM, reduciendo significativamente los costos de inferencia sin comprometer sustancialmente la precisión.

Jingbo Yang, Bairu Hou, Wei Wei, Yujia Bao, Shiyu Chang

Publicado 2026-03-10
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes un asistente virtual muy inteligente (un "agente" de IA) que puede hacer cosas por ti en internet: reservar vuelos, buscar información compleja o navegar por tiendas online.

El problema es que este asistente es como un genio que siempre piensa demasiado. Para cada pequeña tarea, incluso la más sencilla (como hacer clic en un enlace), el genio escribe un ensayo de 10 páginas en su mente antes de actuar. Esto es increíblemente preciso, pero cuesta una fortuna en tiempo y dinero (tokens de computación) y es muy lento.

Por otro lado, si le dices al genio que "piense rápido" para todo, ahorras mucho dinero, pero comete errores tontos y falla en las tareas difíciles.

¿Qué propone el paper ARES?

Los autores crearon un sistema llamado ARES (Selección Adaptativa de Esfuerzo de Razonamiento). Para explicarlo de forma sencilla, imagina que ARES es un jefe de tráfico o un director de orquesta que se sienta junto al genio.

La Analogía del "Jefe de Tráfico"

Imagina que el genio (la IA) es un conductor de un coche de carreras.

  • Sin ARES: El conductor siempre pisa el acelerador a fondo (modo "Alto Esfuerzo"), incluso cuando va por una calle tranquila o en un semáforo. Gasta mucha gasolina y se cansa, pero llega rápido.
  • Con ARES: El "Jefe de Tráfico" (el router de ARES) observa el camino.
    • Si el conductor va a girar en una esquina simple (abrir una URL), el Jefe grita: "¡Frena! Usa el modo 'Bajo Esfuerzo', es fácil".
    • Si el conductor se acerca a un laberinto complejo o una tormenta (navegar por una web confusa o resolver un problema difícil), el Jefe grita: "¡Pisa a fondo! Necesitas el modo 'Alto Esfuerzo' para no chocar".

¿Cómo funciona mágicamente?

El sistema tiene tres pasos clave, como si fuera un entrenamiento de un atleta:

  1. Observar y Etiquetar (El Entrenador): Primero, el equipo observa al genio trabajando con su "máxima potencia" en tareas exitosas. Luego, un entrenador (una IA más pequeña) revisa cada paso y pregunta: "¿Podría el genio haber hecho este paso específico con menos esfuerzo y aun así tener éxito?". Si la respuesta es sí, lo anotan.
  2. Aprender a Justificar (El Razonamiento): No basta con decir "usa modo bajo". El sistema entrena al "Jefe de Tráfico" para que explique por qué. Antes de dar la orden, el Jefe piensa: "El usuario solo quiere abrir una página, es simple, así que usaremos el modo rápido". Esta explicación ayuda al Jefe a ser más inteligente.
  3. Refinar con Premios (El Juego): Finalmente, usan un sistema de recompensas (como un videojuego). Si el Jefe logra que el genio termine la tarea con éxito gastando poca gasolina, gana puntos. Si el genio falla porque el Jefe fue demasiado "ahorrador" en un momento difícil, pierde puntos. Así, el Jefe aprende el equilibrio perfecto.

¿Qué resultados obtuvieron?

En pruebas reales (como reservar vuelos o buscar información profunda), ARES logró algo sorprendente:

  • Ahorro masivo: Redujo el uso de "gasolina" (tokens de razonamiento) en hasta un 52.7% comparado con usar siempre el modo "Alto Esfuerzo".
  • Sin perder precisión: El asistente siguió siendo casi tan bueno como cuando pensaba todo el tiempo. De hecho, en algunos casos, al evitar que el genio "pensara demasiado" (lo que a veces lo confunde), mejoró su rendimiento.

En resumen

ARES es como tener un asistente que sabe cuándo ser un genio y cuándo ser un simple ejecutor.

En lugar de gastar una fortuna pensando en todo, el sistema decide dinámicamente: "Aquí no hace falta un Nobel, hazlo rápido" o "Aquí sí, necesitamos toda la potencia". El resultado es una inteligencia artificial que es más barata, más rápida y igual de inteligente, permitiendo que estas herramientas sean útiles para todos, no solo para quienes pueden pagar los costos más altos.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →