Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs
本論文は、CLIP などの VLM が最適化するモダリティ間距離との一貫性を欠く既存の OOD 検出手法の課題を解決するため、負のテキスト選択と視覚情報のテキスト空間への変換を通じてモダリティ間距離の一貫性を追求する新しいフレームワーク「InterNeg」を提案し、ImageNet や Near-OOD などの大規模ベンチマークで最先端の性能を達成したことを示しています。