When Relevance Meets Novelty: Dual-Stable Periodic Optimization for Serendipitous Recommendation

Questo articolo propone il metodo Co-Evolutionary Alignment (CoEA), che combina il modulo Dual-Stable Interest Exploration (DSIE) per modellare sia le identità di gruppo a lungo termine che gli interessi individuali a breve termine, e il meccanismo Periodic Collaborative Optimization (PCO) per un'ottimizzazione dinamica a ciclo chiuso, al fine di migliorare la serendipità nei sistemi di raccomandazione superando i limiti dei modelli tradizionali e delle attuali architetture basate su LLM.

Hongxiang Lin, Hao Guo, Zeshun Li, Erpeng Xue, Yongqian He, Zhaoyu Hu, Lei Wang, Sheng Chen, Long Zeng

Pubblicato 2026-03-05
📖 4 min di lettura☕ Lettura da pausa caffè

Each language version is independently generated for its own context, not a direct translation.

Immagina di essere in un grande supermercato digitale (come Meituan o Netflix). Il commesso virtuale, che è il sistema di raccomandazione, ha un compito difficile: deve darti esattamente quello che vuoi comprare oggi, ma anche farti scoprire cose nuove e interessanti che non sapevi di amare.

Il problema è che i sistemi tradizionali sono come un amico un po' "testardo": se ti piace il caffè, ti proporrà solo caffè, caffè e ancora caffè. Alla fine, ti annoierai (la cosiddetta "fatica da contenuto") e non scoprirai mai che potresti adorare anche il tè matcha o i biscotti alla cannella.

Gli autori di questo paper, lavorando con Meituan, hanno creato una soluzione intelligente chiamata CoEA (Co-Evolutionary Alignment). Ecco come funziona, spiegato con parole semplici e metafore:

1. Il Problema: Due Nemici da Combattere

I sistemi attuali hanno due difetti principali:

  • Si basano solo sul "qui e ora": Se oggi hai comprato una penna, pensano che tu voglia solo penne. Ignorano chi sei davvero nel lungo periodo (ad esempio, che sei un appassionato di tecnologia da 10 anni).
  • Si fermano dopo il primo tentativo: Una volta che decidono cosa suggerirti, smettono di imparare. Non si aggiornano mentre tu continui a navigare.

2. La Soluzione: Due Cervelli che Lavorano Insieme

Il sistema CoEA usa due "intelligenze artificiali" (LLM) che collaborano come una squadra di calcio:

  • Il "Cervello della Novità" (Novelty LLM): È l'esploratore. Il suo compito è dire: "Ehi, guarda questa cosa strana e nuova!".
  • Il "Cervello della Rilevanza" (Relevance LLM): È il controllore. Il suo compito è dire: "Aspetta, questo è davvero adatto a te o è solo una perdita di tempo?".

3. I Due Segreti della Magia

A. La "Bussola Identitaria" (DSIE - Dual-Stable Interest Exploration)

Immagina che ogni persona abbia due facce:

  1. La tua identità di gruppo: Sei un "appassionato di cucina", un "fan di calcio" o un "geek della tecnologia". Queste cose non cambiano spesso.
  2. I tuoi capricci di oggi: Oggi hai comprato un gatto, quindi forse vuoi un giocattolo per gatti.

Il sistema CoEA non guarda solo cosa hai comprato oggi. Usa una bussola per capire la tua "identità di gruppo" (il tuo lungo termine) e la combina con i tuoi capricci recenti.

  • Metafora: È come se il commesso non ti chiedesse solo "Cosa vuoi comprare ora?", ma guardasse anche il tuo passaporto per sapere che sei un "appassionato di viaggi" e ti suggerisse una valigia nuova, anche se oggi stavi solo comprando il latte.

B. L'Allenamento Continuo (PCO - Periodic Collaborative Optimization)

Qui sta la vera innovazione. I vecchi sistemi facevano un allenamento una volta sola e poi si fermavano. CoEA è come un atleta che si allina ogni giorno.

Ecco il ciclo infinito:

  1. Il Cervello della Novità suggerisce 10 idee nuove.
  2. Il Cervello della Rilevanza le controlla e dice: "Queste 3 sono ottime, queste 7 sono noiose".
  3. Il sistema prende i feedback (le 3 idee buone) e ri-allena il Cervello della Novità immediatamente.
  4. Il Cervello della Novità diventa più bravo, suggerisce cose ancora meglio, e il ciclo ricomincia.

È un circolo virtuoso: più il sistema ti conosce, più ti suggerisce cose nuove che ti piaceranno davvero, senza mai dimenticare chi sei.

4. Il Risultato: La "Sorpresa Perfetta"

Grazie a questo metodo, il sistema non ti intrappola più in una gabbia di contenuti vecchi.

  • Offline (i test): Ha scoperto categorie di prodotti che nessun altro aveva trovato, mantenendo un'alta qualità.
  • Online (nella realtà su Meituan): Quando lo hanno provato sugli utenti veri, le persone hanno speso di più (perché trovavano cose che amavano davvero) e hanno scoperto molti più prodotti nuovi.

In Sintesi

Immagina un amico che ti accompagna a fare shopping.

  • I vecchi sistemi sono amici che ti portano sempre nello stesso negozio di scarpe perché sai che ti piacciono.
  • CoEA è un amico che conosce la tua storia (ti piace lo sport, la musica, il cibo) e oggi ti dice: "So che di solito compri solo scarpe, ma ho visto che sei un fan della tecnologia da anni. Guarda questa nuova cuffia sportiva! È perfetta per te e non l'hai mai vista prima!".

È un equilibrio perfetto tra ciò che ti piace e ciò che potresti amare, aggiornato ogni singolo giorno.