AdaIAT: Adaptively Increasing Attention to Generated Text to Alleviate Hallucinations in LVLM
Il paper propone AdaIAT, un metodo che mitiga le allucinazioni nei modelli visione-linguaggio su larga scala adattivamente aumentando l'attenzione sui token generati, riducendo così gli errori visivi senza compromettere la coerenza linguistica o causare descrizioni ripetitive.