When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Este artículo presenta CoEA, un método de recomendación serendípica que supera las limitaciones de los sistemas tradicionales y de los marcos actuales basados en LLM mediante el módulo DSIE para modelar intereses grupales e individuales y el mecanismo PCO para lograr una optimización dinámica en bucle cerrado que equilibra relevancia y novedad.

Hongxiang Lin, Hao Guo, Zeshun Li, Erpeng Xue, Yongqian He, Zhaoyu Hu, Lei Wang, Sheng Chen, Long Zeng

Publicado 2026-03-05
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

Imagina que tienes un amigo muy cercano que te recomienda películas, libros o restaurantes.

El Problema: El "Bucle de la Zona de Confort"

Actualmente, la mayoría de los sistemas de recomendación (como los de Netflix o TikTok) son como ese amigo que, si le dices que te gusta la pizza, te sigue recomendando pizza durante años.

  • Lo bueno: Siempre acierta en lo que te gusta (Relevancia).
  • Lo malo: Te aburres. Nunca te sugiere sushi, ni tacos, ni una nueva serie de ciencia ficción. Te quedas atrapado en un "bucle de retroalimentación" donde solo ves lo que ya conoces. Esto se llama fatiga de contenido.

La Solución: CoEA (Alineación Evolutiva Conjunta)

Los autores de este paper (de Meituan y la Universidad Tsinghua) crearon un nuevo sistema llamado CoEA. Imagina que CoEA no es un solo amigo, sino un equipo de dos expertos que trabajan juntos, pero con una forma muy especial de aprender.

1. Los Dos Expertos (El Dúo Dinámico)

En lugar de un solo algoritmo, usan dos "Inteligencias Artificiales" (LLMs) que se especializan en cosas distintas:

  • El Experto en "Lo Nuevo" (Novelty LLM): Es el explorador aventurero. Su trabajo es pensar: "¿Qué cosas increíbles y desconocidas podría gustarle a esta persona?". Es como ese amigo que siempre te dice: "¡Prueba este restaurante exótico!".
  • El Experto en "Lo que te Gusta" (Relevance LLM): Es el crítico exigente. Su trabajo es decir: "Espera, ¿de verdad le va a gustar eso? ¿O es solo una locura?". Actúa como un filtro de calidad.

2. El Secreto: No solo miran el "ahora" (Exploración de Interés Dual-Estable)

Aquí es donde el sistema es brillante. La mayoría de los sistemas solo miran lo que hiciste ayer (intereses a corto plazo).

  • El error común: Si ayer compraste un regalo de cumpleaños, el sistema piensa que te gustan los regalos y te sigue recomendando regalos.

  • La solución de CoEA: Mira dos cosas a la vez:

    1. Tu identidad a largo plazo: ¿Eres un "fanático de la tecnología" o un "amante de la cocina"? Esto es estable y no cambia en días.
    2. Tu estado actual: ¿Qué estás buscando hoy?

    La analogía: Imagina que eres un "fanático de la tecnología" (identidad a largo plazo). Hoy compraste un "kit de repostería" (interés a corto plazo).

    • Un sistema normal te recomendaría más repostería.
    • CoEA piensa: "Ah, es un fanático de la tecnología que hoy está haciendo pasteles. ¡Quizás le gusten los robots de cocina o los gadgets para hornear!".

    Así, encuentra lo nuevo (gadgets) que encaja con tu identidad real (tecnología), evitando que te aburras con repostería infinita.

3. El Ciclo de Aprendizaje Infinito (Optimización Periódica Colaborativa)

Aquí está la magia final. En los sistemas viejos, los dos expertos se alinean una sola vez y se quedan quietos. Si el usuario cambia, el sistema no se da cuenta.

CoEA funciona como un entrenamiento deportivo continuo:

  1. El "Explorador" sugiere ideas nuevas.
  2. El "Crítico" las revisa y dice: "Esta es buena, esta es mala".
  3. El giro: El "Explorador" aprende de las correcciones del "Crítico" y se entrena de nuevo.
  4. Luego, el "Crítico" vuelve a revisar las nuevas ideas del "Explorador" (que ahora es más inteligente).
  5. Esto se repite constantemente con los datos nuevos que llegan cada día.

Es un bucle cerrado: El sistema nunca se queda obsoleto. Aprende y se adapta en tiempo real, mejorando cada vez que interactúas con él.

¿Qué lograron?

En las pruebas reales (en la app de Meituan, que es como el Uber de comida en China):

  • Más dinero (GTV): La gente compró más porque las recomendaciones eran mejores.
  • Más novedad (NIEP): La gente descubrió categorías de productos que nunca había visto antes, pero que les encantaron.

En resumen

CoEA es como tener un amigo que conoce tu alma (tus gustos profundos y estables) pero que también es curioso y aventurero. No te empuja solo a lo que ya sabes que te gusta, sino que te presenta cosas nuevas que, aunque nunca has probado, encajan perfectamente con quién eres. Y lo mejor: aprende de sus errores cada día para ser un mejor amigo para ti.