Quantifying Genuine Awareness in Hallucination Prediction Beyond Question-Side Shortcuts
Die Studie stellt mit der Approximate Question-side Effect (AQE)-Methode ein Verfahren vor, um zu zeigen, dass bestehende Methoden zur Halluzinationserkennung in Sprachmodellen stark auf Benchmark-Manipulationen statt auf echtes internes Bewusstsein angewiesen sind.