KVSmooth: Mitigating Hallucination in Multi-modal Large Language Models through Key-Value Smoothing
El artículo presenta KVSmooth, un método gratuito y plug-and-play que mitiga las alucinaciones en modelos de lenguaje multimodal grandes mediante un suavizado adaptativo de los estados ocultos guiado por la entropía de la atención, mejorando significativamente la precisión y el recall sin necesidad de reentrenamiento.