Quantifying Genuine Awareness in Hallucination Prediction Beyond Question-Side Shortcuts
既存の幻覚検出手法の性能が、モデルの真の内部情報への気づきではなく、質問側の情報を利用したベンチマークハッキングに依存していることを示すため、人間の手間をかけずにこの影響を定量化する手法「Approximate Question-side Effect (AQE)」を提案し、その分析結果を通じて既存手法の限界を明らかにした。