Quantifying Genuine Awareness in Hallucination Prediction Beyond Question-Side Shortcuts
Dit paper introduceert de AQE-methode om aan te tonen dat bestaande methoden voor het detecteren van hallucinaties bij taalmodellen grotendeels afhankelijk zijn van benchmarkspecifieke trucs in plaats van echte bewustwording van interne informatie.