AEX: Non-Intrusive Multi-Hop Attestation and Provenance for LLM APIs

El artículo presenta AEX, una extensión de atestación no intrusiva para APIs de modelos de lenguaje grandes que añade un objeto firmado para vincular criptográficamente las solicitudes de los clientes con sus respuestas o líneas de origen, garantizando así la integridad y la procedencia de los datos incluso en entornos con intermediarios de confianza o flujos de transmisión.

Yongjie Guan

Publicado 2026-03-17
📖 5 min de lectura🧠 Análisis profundo

Each language version is independently generated for its own context, not a direct translation.

Imagina que has pedido un plato de comida a un restaurante muy famoso (el modelo de Inteligencia Artificial). El camarero (la API) te trae el plato. Pero, ¿cómo sabes con certeza que:

  1. El plato que tienes en la mesa es exactamente lo que pediste en el menú?
  2. Nadie en la cocina le cambió los ingredientes a mitad del camino?
  3. El plato no fue robado de otra mesa o preparado por un cocinero desconocido?

Hoy en día, con las Inteligencias Artificiales (como ChatGPT), confiamos ciegamente en que lo que nos devuelve la empresa es lo que realmente pidió el usuario. Pero recientemente se ha descubierto que hay "restaurante fantasma" (APIs no oficiales) que dicen ser el original pero sirven comida diferente, o que intermediarios cambian el pedido sin avisar.

Aquí es donde entra AEX.

¿Qué es AEX? (La "Etiqueta de Seguridad Sellada")

AEX es como un sistema de precinto de seguridad digital que se pega en la respuesta de la Inteligencia Artificial. No cambia la comida (el texto que te devuelve), no cambia el menú (la petición), ni obliga a la cocina a cambiar su forma de trabajar. Simplemente, añade una etiqueta sellada y firmada en la parte superior del plato.

Esta etiqueta dice: "Yo, el Chef Confiable, certifico que este plato específico es el resultado exacto de este pedido específico, y nadie lo ha tocado desde que salió de mi cocina hasta que llegó a tu mesa."

¿Cómo funciona? (Con analogías sencillas)

1. La "Huella Digital" del Pedido (Compromiso de la Petición)

Cuando pides algo, AEX toma tu pedido y le saca una "huella digital" única (un código matemático).

  • El problema: A veces, un intermediario (como un traductor o un filtro de seguridad) cambia tu pedido ligeramente (por ejemplo, añade un código de seguimiento).
  • La solución de AEX: Permite que tú, el cliente, elijas qué tan estricto quieres ser. Puedes decir: "Solo quiero que se fijen en el texto principal, ignora los códigos de seguimiento" o "Quiero que todo sea idéntico, hasta el último punto". Si alguien cambia algo que no debió, la huella digital no coincidirá y la etiqueta se romperá.

2. La "Cinta de Seguridad" para Mensajes Largos (Streaming)

A veces, la IA no te da la respuesta de golpe, sino palabra por palabra (como si te la fuera dictando).

  • El problema: ¿Qué pasa si alguien borra una palabra, añade una mentira en medio o corta la frase antes de tiempo?
  • La solución de AEX: Imagina que cada palabra que sale tiene un pequeño eslabón de una cadena. Si alguien intenta cambiar una palabra en medio, rompe la cadena. AEX verifica que la cadena esté completa y en orden. Si la cadena se corta antes de tiempo, la etiqueta te avisa: "¡Ojo! La historia se cortó antes de terminar".

3. La "Cadena de Custodia" (Cuando alguien toca el plato)

A veces, un intermediario confiable (como un filtro de seguridad) necesita editar la respuesta (por ejemplo, borrar una palabra ofensiva o resumir un texto largo).

  • El problema: Si alguien edita el texto, la huella digital original ya no sirve. ¿Cómo sabemos que la edición fue legítima?
  • La solución de AEX: AEX crea una cadena de custodia firmada.
    • El Chef original firma el plato base.
    • El Filtro de Seguridad (intermediario) firma un recibo que dice: "Tomé el plato del Chef, le quité la salsa picante y lo entregué así".
    • Tú recibes el plato modificado, pero con una etiqueta que muestra toda la historia: "Este plato vino del Chef X, pasó por el Filtro Y, y fue modificado legalmente".
    • Si un hacker intenta cambiar el plato sin firmar el recibo, la etiqueta se rompe y te das cuenta.

¿Qué NO hace AEX? (Lo que no es magia)

Es importante no confundirse. AEX no es un detector de mentiras sobre el contenido:

  • No te dice si la IA inventó un hecho falso (alucinación).
  • No te dice si la IA usó un modelo diferente al que dice usar (aunque ayuda a detectar si la respuesta no coincide con el pedido).
  • No te dice si la IA tiene "pensamientos ocultos" o secretos.

AEX solo garantiza la integridad del viaje: que el pedido que saliste y la respuesta que recibiste están vinculados matemáticamente y que nadie los manipuló en el camino sin permiso.

En resumen

AEX es como poner un sello de garantía oficial en cada interacción con una Inteligencia Artificial.

  • Si el sello está intacto, sabes que la respuesta es auténtica y no ha sido manipulada.
  • Si alguien intentó cambiar el pedido o la respuesta, el sello se rompe y te avisa.
  • Si hubo cambios legítimos (como filtros de seguridad), el sello muestra quién los hizo y cómo, manteniendo la confianza.

Es una herramienta para que, en un mundo donde las IAs pueden ser manipuladas o reemplazadas por "impostores", tú tengas la certeza de que lo que ves es exactamente lo que pediste y lo que el proveedor prometió entregar.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →