Quantifying Genuine Awareness in Hallucination Prediction Beyond Question-Side Shortcuts
Cet article propose une méthode nommée AQE pour quantifier l'effet des raccourcis liés aux questions dans la détection d'hallucinations, révélant ainsi que les performances actuelles reposent largement sur l'exploitation des benchmarks plutôt que sur une véritable conscience du modèle.