SOLARIS: Speculative Offloading of Latent-bAsed Representation for Inference Scaling

El artículo presenta SOLARIS, un marco innovador inspirado en la decodificación especulativa que desacopla la inferencia de modelos fundacionales costosos de la ruta de servicio en tiempo real mediante la precomputación asíncrona de representaciones latentes, logrando un aumento del 0,67% en métricas de ingresos en el sistema de publicidad de Meta.

Zikun Liu, Liang Luo, Qianru Li, Zhengyu Zhang, Wei Ling, Jingyi Shen, Zeliang Chen, Yaning Huang, Jingxian Huang, Abdallah Aboelela, Chonglin Sun, Feifan Gu, Fenggang Wu, Hang Qu, Huayu Li, Jill Pan, Kaidi Pei, Laming Chen, Longhao Jin, Qin Huang, Tongyi Tang, Varna Puvvada, Wenlin Chen, Xiaohan Wei, Xu Cao, Yantao Yao, Yuan Jin, Yunchen Pu, Yuxin Chen, Zijian Shen, Zhengkai Zhang, Dong Liang, Ellie Wen

Publicado 2026-04-15
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que Meta (la empresa dueña de Facebook, Instagram, etc.) tiene un chef estrella (un modelo de inteligencia artificial gigante) que sabe exactamente qué comida le gustaría a cada cliente. Este chef es increíblemente sabio porque ha probado millones de platos y conoce los gustos de todo el mundo.

Sin embargo, hay un problema: este chef es muy lento. Si un cliente llega a la puerta y pide algo "al instante", el chef no puede cocinar ese plato específico en el tiempo que tarda en abrir la puerta. Si intentamos esperar a que cocine, el cliente se aburre y se va.

Antes, la solución era tener un cocinero junior (un modelo más pequeño y rápido) que intentaba adivinar qué quería el cliente basándose en recetas simples. Pero el junior no sabía tanto como el chef estrella, y los platos no eran tan buenos.

Aquí es donde entra SOLARIS.

¿Qué es SOLARIS? (La analogía del "Menú Predicativo")

SOLARIS es como un sistema de "adivinanzas inteligentes" que permite al chef estrella ayudar al cocinero junior sin ralentizar el servicio. Funciona así:

  1. La Adivinanza (Precomputación Especulativa):
    En lugar de esperar a que el cliente pida, SOLARIS observa el comportamiento de la gente y dice: "¡Oye! Es muy probable que el Sr. García quiera ver un anuncio de zapatillas deportivas en los próximos 10 minutos".
    Mientras el Sr. García aún está caminando hacia la tienda, el chef estrella ya ha preparado el plato (ha creado una representación matemática de ese anuncio para ese usuario) y lo ha dejado listo en un estante.

  2. El Servicio Rápido (Descarga Asincrónica):
    Cuando el Sr. García finalmente llega y pide el anuncio, el cocinero junior no tiene que esperar a que el chef cocine. Solo tiene que tomar el plato ya preparado del estante y servirlo al instante.

    • Resultado: El cliente recibe un plato de alta calidad (del chef estrella) tan rápido como si lo hubiera hecho el junior.
  3. El Plan B (Rellenar los huecos):
    ¿Qué pasa si el Sr. García pide algo que el chef no pudo predecir? ¿O si el plato ya se enfrió (caducó)?
    SOLARIS tiene un truco de magia:

    • Promedio: Si no tiene el plato exacto, mira lo que el Sr. García pidió ayer y hoy, y hace un "plato promedio" que suele funcionar bien.
    • El Vecino: Si no sabe qué le gusta al Sr. García, busca a su vecino (alguien con gustos muy similares) y le ofrece lo que al vecino le encanta. Como son similares, es muy probable que al Sr. García también le guste.

¿Por qué es un gran avance?

  • Antes: Teníamos que elegir entre calidad (chef lento) o velocidad (junior rápido). O usábamos técnicas viejas que solo transferían el 20% del conocimiento del chef al junior.
  • Ahora con SOLARIS: Logramos transferir casi el doble de conocimiento (42-44%) sin perder velocidad. El junior se vuelve casi tan sabio como el chef, pero sigue siendo rápido.

Los Resultados en la Vida Real

Meta probó esto en sus anuncios diarios (miles de millones de veces al día).

  • Mejor precisión: Los anuncios que se mostraron fueron mucho más relevantes para los usuarios.
  • Más dinero: Gracias a que la gente hizo clic en anuncios que realmente les interesaban, Meta ganó cientos de millones de dólares extra (un aumento del 0.67% en los ingresos totales, lo cual es una cantidad enorme a esa escala).

En resumen

SOLARIS es como tener un asistente mágico que piensa con antelación. Le dice al chef estrella: "Prepara esto para mañana" y le dice al cocinero junior: "Aquí tienes el plato listo, sirve rápido".

De esta forma, Meta puede usar sus modelos de inteligencia artificial más potentes y complejos en tiempo real, ofreciendo a los usuarios experiencias personalizadas de alta calidad sin que nadie tenga que esperar ni un segundo.

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →