When & How to Write for Personalized Demand-aware Query Rewriting in Video Search

El paper presenta WeWrite, un marco innovador de reescritura de consultas para búsqueda de video que utiliza una estrategia de minería posterior para determinar cuándo personalizar, un entrenamiento híbrido (SFT y GRPO) para optimizar cómo reescribir y una arquitectura de "Fake Recall" para garantizar baja latencia, logrando mejoras significativas en el volumen de clics y la reducción de reformulación de consultas en pruebas A/B a gran escala.

Cheng cheng, Chenxing Wang, Aolin Li, Haijun Wu, Huiyun Hu, Juyuan Wang

Publicado 2026-02-23
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que el buscador de videos de una aplicación (como los canales de WeChat) es como un bibliotecario gigante que tiene millones de libros (videos) pero a veces no entiende bien lo que quieres.

Aquí te explico el paper "WeWrite" como si fuera una historia sobre cómo mejorar a ese bibliotecario, usando analogías sencillas:

🎯 El Problema: El Bibliotecario Confundido

Imagina que entras a la biblioteca y dices: "Quiero ver a Guang Liang".

  • El problema: "Guang Liang" puede ser un cantante famoso o una marca de licor.
  • El error antiguo: El bibliotecario tradicional te da resultados para ambos o adivina al azar. Si tú en realidad querías el licor porque estás planeando una fiesta, pero te muestra videos del cantante, te frustras y tienes que volver a preguntar: "¡No, el licor!". Esto es molesto y lento.

Además, si buscas algo muy específico como "cómo usar una freidora de aire", el bibliotecario no debería cambiar tu búsqueda basándose en que ayer viste videos de chistes de parejas. ¡Eso sería confundir tus intenciones!

💡 La Solución: "WeWrite", el Bibliotecario Inteligente

Los autores crearon un sistema llamado WeWrite que actúa como un bibliotecario con "superpoderes" que lee tu mente (tu historial) pero solo cuando es realmente necesario. Se plantean dos preguntas clave: ¿Cuándo escribir? y ¿Cómo escribir?

1. ¿Cuándo escribir? (El Semáforo de la Necesidad)

Antes, el bibliotecario intentaba reescribir todo lo que decías, lo cual generaba ruido.

  • La analogía: Imagina un semáforo inteligente.
  • Cómo funciona: El sistema observa tu comportamiento. Si buscas algo y no haces clic en nada (te aburres en 2 segundos), el semáforo se pone en ROJO (¡Error! No le gustó). Si luego cambias la búsqueda y ves un video por más de 10 segundos, el semáforo se pone en VERDE (¡Éxito!).
  • La magia: El sistema solo aprende a reescribir cuando ve que el usuario realmente necesitó ayuda para encontrar lo que quería. Si tu búsqueda original fue perfecta, el sistema dice: "¡No toques nada!" y deja que sigas buscando tal cual. Esto evita que te recomiende cosas raras solo porque ayer viste un video de gatos.

2. ¿Cómo escribir? (El Entrenamiento de Estilo)

Una vez que saben que deben ayudar, ¿cómo lo hacen? Aquí usan una técnica de entrenamiento de dos pasos para la Inteligencia Artificial (IA):

  • Paso A (SFT - Supervisión): Le enseñan al bibliotecario ejemplos de "buenas correcciones". Es como darle un libro de reglas: "Si el usuario busca 'Guang Liang' y antes vio videos de licor, la respuesta correcta es 'Licor Guang Liang'".
  • Paso B (GRPO - Refinamiento por Recompensa): Aquí está la parte genial. A veces, la IA puede inventar palabras muy raras que el bibliotecario no encuentra en sus estantes. Para evitar esto, usan un sistema de premios y castigos.
    • Si la IA sugiere una frase que la gente suele buscar y le da muchos "me gusta" (clics), gana puntos.
    • Si inventa una frase que nadie usa, pierde puntos.
    • El resultado: La IA aprende a hablar el "idioma" que el sistema de búsqueda entiende mejor, sin perder la esencia de lo que tú quieres.

3. El Truco de Magia: "Recall Falso" (Fake Recall)

El mayor miedo al usar IA en búsquedas en tiempo real es la velocidad. Si la IA tarda 2 segundos en pensar, el usuario se va.

  • La analogía: Imagina que el bibliotecario tiene un asistente fantasma que trabaja en paralelo.
  • Cómo funciona: Mientras el sistema principal busca tus videos (la búsqueda normal), el asistente fantasma (la IA) empieza a pensar tu nueva búsqueda al mismo tiempo.
  • El truco: El asistente tiene una "lista de resultados pre-cargada" (un índice falso) con los videos más populares. Si la IA piensa en una nueva búsqueda, consulta esa lista instantáneamente.
  • El efecto: Cuando el sistema principal termina su búsqueda, el asistente ya tiene los resultados listos. Se unen los dos resultados y te los muestra. Tú no sientes ningún retraso. Es como si el bibliotecario hubiera adivinado lo que querías antes de que terminaras de hablar.

🏆 Los Resultados (El Final Feliz)

Cuando probaron esto en la vida real con millones de usuarios:

  1. Más videos vistos: La gente vio más videos durante más de 10 segundos (porque encontró lo que quería más rápido).
  2. Menos frustración: La gente dejó de tener que corregir sus búsquedas tantas veces.

En resumen:
"WeWrite" es como darle a un bibliotecario un mapa de tus gustos, enseñarle a esperar a que realmente necesites ayuda antes de intervenir, y darle un asistente fantasma para que todo sea instantáneo. ¡Así, cuando buscas algo, la app simplemente "te entiende"!

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →