HIME: Mitigating Object Hallucinations in LVLMs via Hallucination Insensitivity Model Editing

El artículo presenta HIME, un método de edición de modelos que mitiga las alucinaciones de objetos en modelos de lenguaje y visión grandes mediante la identificación y modificación selectiva de capas específicas basada en un nuevo índice de insensibilidad a alucinaciones, logrando una reducción significativa de errores sin incurrir en costes computacionales adicionales.

Ahmed Akl, Abdelwahed Khamis, Ali Cheraghian, Zhe Wang, Sara Khalifa, Kewen Wang

Publicado 2026-02-24
📖 4 min de lectura☕ Lectura para el café

Each language version is independently generated for its own context, not a direct translation.

¡Claro que sí! Imagina que los Modelos de Lenguaje y Visión Grandes (LVLMs) son como unos detectives muy inteligentes que pueden ver una foto y contarte una historia sobre ella. Son increíbles, pero tienen un defecto: a veces, cuando están nerviosos o quieren impresionar, inventan cosas que no están en la foto.

Por ejemplo, si ves una foto de un perro en una cama, el detective podría decir: "¡Mira! Hay un perro en una cama, y al lado hay un sofá y una silla". Pero si miras bien la foto, solo hay una cama. ¡El sofá y la silla son alucinaciones! El detective los inventó porque en su "mente" (su entrenamiento), las camas suelen ir acompañadas de sofás.

Aquí es donde entra la propuesta de este paper, llamada HIME. Vamos a explicarlo con una analogía sencilla:

1. El Problema: El Detective que "Sabe Demasiado"

Antes, para arreglar a estos detectives, los científicos hacían dos cosas:

  • Reentrenarlos: Era como enviar al detective a una escuela nueva durante meses. Muy caro y lento.
  • Editar el cerebro de golpe: Era como darle un "golpe" a todo su cerebro de una vez para que dejara de inventar. El problema es que, al hacerlo así, a veces el detective dejaba de inventar cosas, pero también olvidaba cosas reales.
    • Ejemplo: Al quitarle la idea de "sofás", le quitamos también la idea de "cama". ¡Ahora el detective ve la cama pero no sabe qué es!

2. La Solución: HIME (El Cirujano de Precisión)

Los autores de este paper (HIME) dicen: "¡Espera! No necesitamos golpear todo el cerebro. Necesitamos saber exactamente en qué parte del cerebro ocurre la alucinación".

Para esto, crearon una herramienta llamada HIS (Puntaje de Inalucinabilidad).

La Analogía del Edificio de Pisos

Imagina que el cerebro del detective es un edificio de 30 pisos (capas de la red neuronal).

  • Pisos bajos: Aquí el detective mira la foto y ve los colores y formas básicas.
  • Pisos medios: Aquí empieza a entender qué son las cosas (es un perro, es una cama).
  • Pisos altos: Aquí el detective decide qué palabras decir y cuenta la historia.

El paper descubrió algo fascinante: La alucinación no ocurre en todos los pisos por igual.

  • En algunos pisos, el detective es muy preciso.
  • En otros pisos (especialmente los medios y altos), es donde empieza a "soñar despierto" y a inventar el sofá que no existe.

3. ¿Cómo funciona HIME?

HIME actúa como un cirujano de precisión o un arquitecto inteligente:

  1. El Diagnóstico (HIS): Primero, el sistema revisa cada piso del edificio para ver cuál es el "culpable" de inventar cosas. Usa una métrica llamada HIS para medir: "¿Qué tan sensible es este piso a inventar mentiras?".

    • Si un piso es muy sensible a mentir, el sistema le pone una etiqueta de "Zona de Peligro".
    • Si un piso es muy honesto, lo deja tranquilo.
  2. La Cirugía (Edición de Pesos): En lugar de golpear todo el edificio, HIME va piso por piso y hace un ajuste muy suave solo en los pisos problemáticos.

    • Imagina que ajustas las tuercas de un motor. HIME afloja las tuercas que hacen que el detective invente el sofá, pero aprieta las que le ayudan a reconocer la cama.
    • Es como si le dijeras al detective: "Oye, en este momento de la historia, no inventes el sofá, pero sigue viendo la cama".

4. El Resultado: Un Detective Perfecto

Gracias a este método:

  • Menos mentiras: El detective deja de inventar objetos que no están (el sofá desaparece de la historia).
  • Más verdad: Sigue reconociendo perfectamente lo que sí está (el perro y la cama).
  • Sin costo extra: A diferencia de otras técnicas que hacen que el detective sea más lento o necesite más energía, HIME es como un "parche" que se aplica una sola vez. Una vez arreglado, el detective trabaja a la misma velocidad que antes.

En resumen

HIME es como un entrenador personal para la inteligencia artificial que no le grita a todo el equipo, sino que identifica exactamente a qué jugador se le está escapando la pelota (la alucinación) y le da un consejo específico para que juegue mejor, sin molestar a los otros jugadores que ya están jugando bien.

El resultado es una IA que ve el mundo tal como es, sin inventar sofás donde solo hay camas, manteniendo su inteligencia y velocidad intactas. ¡Una victoria para la confianza en la tecnología!

Recibe artículos como este en tu bandeja de entrada

Resúmenes diarios o semanales personalizados según tus intereses. Gists o resúmenes técnicos, en tu idioma.

Probar Digest →