LCM: Lossless Context Management

Este artículo presenta la Gestión de Contexto sin Pérdidas (LCM), una arquitectura determinista que mejora la memoria de los LLM mediante compresión recursiva del contexto y partición de tareas, permitiendo que el agente Volt supere a Claude Code en tareas de codificación de contexto largo de hasta 1 millón de tokens, garantizando al mismo tiempo la recuperación sin pérdidas del estado y la finalización.

Autores originales: Clint Ehrlich, Theodore Blackman

Publicado 2026-05-07
📖 5 min de lectura🧠 Análisis profundo

Autores originales: Clint Ehrlich, Theodore Blackman

Artículo original bajo licencia CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Esta es una explicación generada por IA del artículo a continuación. No ha sido escrita ni avalada por los autores. Para mayor precisión técnica, consulte el artículo original. Leer descargo de responsabilidad completo

Each language version is independently generated for its own context, not a direct translation.

Imagina que estás intentando resolver un misterio masivo de varios días. Tienes un detective brillante (la IA), pero tiene una memoria muy a corto plazo. Si le das una pila de 1.000 pistas, olvidará las primeras antes de llegar a la última.

Durante mucho tiempo, la solución fue simplemente darle al detective un cuaderno más grande (una "ventana de contexto" más grande). Pero eventualmente, incluso los cuadernos más grandes se vuelven demasiado pesados para llevar, y el detective empieza a confundirse por el volumen abrumador de papel.

Este artículo presenta una nueva forma de ayudar al detective: Gestión de Contexto sin Pérdida (LCM). Piénsalo como darle al detective un bibliotecario automatizado superinteligente que gestiona las notas por él, en lugar de pedirle al detective que escriba su propio sistema de archivo.

Así es como funciona, usando analogías simples:

1. El Problema: El Debate "GOTO" vs. "Estructurado"

El artículo compara dos formas de manejar la memoria:

  • La Vieja Forma (RLM): Imagina pedirle al detective que escriba su propio sistema de archivo en código. Tiene que decidir cómo organizar las notas, cuándo tirar cosas y cómo encontrarlas más tarde. Esto es como darle a un programador libertad ilimitada para usar declaraciones GOTO (saltar a cualquier parte del código). Es poderoso, pero si el detective comete un error en su guion de archivo, todo el sistema se bloquea o se desordena.
  • La Nueva Forma (LCM): En lugar de pedirle al detective que escriba el sistema de archivo, el motor (el ordenador que ejecuta al detective) proporciona un archivador preconstruido y perfecto. El detective solo dice: "Aquí hay una nueva pista", y el motor decide automáticamente cuándo resumir las pistas antiguas y dónde almacenarlas. Esto es como usar programación estructurada (bucles y sentencias if): es menos flexible, pero nunca se bloquea por mala lógica.

2. Las Dos Herramientas Mágicas de LCM

El artículo dice que LCM utiliza dos trucos principales para mantener al detective enfocado:

A. El Archivador "Sin Pérdida" (DAG Jerárquico)

  • Cómo funciona: El motor mantiene una "Copia Maestra" de cada nota, palabra por palabra, en una bóveda segura (el Almacén Inmutable).
  • El Resumen: Para ahorrar espacio en el espacio de trabajo activo del detective, el motor crea una "tarjeta de resumen" para las notas antiguas. Coloca la tarjeta de resumen en el espacio de trabajo y oculta la nota completa en la bóveda.
  • La Magia: Si el detective necesita ver la nota original más tarde, puede pedirla, y el motor intercambia instantáneamente la tarjeta de resumen por la nota completa. Nada se pierde realmente; solo se comprime hasta que se necesita.
  • Analogía: Imagina leer un libro de 500 páginas. En lugar de llevar todo el libro, llevas un marcador con un resumen de una oración de cada capítulo. Si necesitas verificar un detalle, vuelves a la página específica del libro. Nunca pierdes el texto original.

B. El Equipo "Paralelo" (LLM-Map)

  • El Problema: Si el detective tiene que leer 1.000 archivos uno por uno, se cansará y olvidará el primer archivo para cuando llegue al último.
  • La Solución: En lugar de que el detective lea los archivos él mismo, el motor actúa como un jefe que contrata a 16 asistentes. El detective le da al jefe una sola instrucción: "Lee estos 1.000 archivos y dime el punto principal de cada uno". El motor envía los 1.000 archivos a los asistentes simultáneamente.
  • El Resultado: Los asistentes hacen el trabajo pesado en paralelo. El detective solo ve la lista final y organizada de resultados. El detective nunca tiene que sostener 1.000 archivos en su cabeza a la vez.

3. La Promesa de "Coste Cero"

Una de las mayores afirmaciones del artículo es que este sistema no ralentiza las cosas para tareas pequeñas.

  • Analogía: Si solo tienes 5 notas para archivar, el motor no se molesta en crear un sistema de archivo complejo. Simplemente deja que el detective las lea directamente. El "archivador" solo entra en acción cuando la pila se vuelve demasiado grande. Esto significa que, para conversaciones normales y cortas, el sistema se siente tan rápido como una IA estándar.

4. Los Resultados: Venciendo a la Competencia

Los autores probaron su sistema (llamado Volt) contra Claude Code, que actualmente es uno de los mejores asistentes de codificación con IA del mundo.

  • La Prueba: Le dieron a ambos sistemas un "misterio" masivo con hasta 1 millón de palabras de pistas (tokens).
  • El Resultado:
    • Para pistas pequeñas (menos de 32.000 palabras), ambos sistemas funcionaron aproximadamente igual.
    • Para pistas enormes (de 32.000 a 1 millón de palabras), Volt ganó en todo momento.
    • El artículo afirma que Volt fue significativamente mejor encontrando la respuesta correcta en conjuntos de datos masivos porque no se "confundió" por el volumen de texto, mientras que Claude Code empezó a tener dificultades a medida que el texto se hacía más largo.

5. Por Qué Esto Importa (Según el Artículo)

El artículo argumenta que pedirle a una IA que gestione su propia memoria (como la "Vieja Forma") es arriesgado porque la IA puede cometer errores en su propio código. Al mover la gestión de la memoria al motor del ordenador (la "Nueva Forma"), el sistema se vuelve:

  1. Más Confiable: No se bloquea porque la IA escribió un mal guion.
  2. Más Eficiente: Maneja grandes cantidades de datos sin que la IA se abrume.
  3. Sin Pérdida: Garantiza que ninguna información se elimine realmente, solo se resuma.

En resumen, el artículo sugiere que para tareas muy largas y complejas, es mejor darle a la IA un asistente automatizado y estructurado para manejar la memoria, en lugar de dejar que la IA intente ser ella misma la bibliotecaria.

¿Ahogado en artículos de tu campo?

Recibe resúmenes diarios de los artículos más novedosos que coincidan con tus palabras clave de investigación — con resúmenes técnicos, en tu idioma.

Probar Digest →