Quantifying Genuine Awareness in Hallucination Prediction Beyond Question-Side Shortcuts
Il paper propone il metodo AQE per quantificare quanto le prestazioni attuali nella rilevazione delle allucinazioni dipendano da scorciatoie legate alle domande piuttosto che da una genuina consapevolezza del modello, rivelando che le tecniche esistenti si basano eccessivamente su tali scorciatoie.