Quantifying Genuine Awareness in Hallucination Prediction Beyond Question-Side Shortcuts
Este artigo propõe a metodologia AQE para quantificar a dependência de métodos existentes de detecção de alucinações em "hacks" de benchmark baseados na pergunta, revelando que sua performance aparente não reflete uma verdadeira consciência do modelo sobre suas informações internas.