SuperADD: Training-free Class-agnostic Anomaly Segmentation -- CVPR 2026 VAND 4.0 Workshop Challenge Industrial Track

本論文は、DINOv3 バックボーンと堅牢な前処理技術を駆使して、クラスごとのハイパーパラメータ調整を必要とすることなく、困難な分布シフト下で MVTec AD 2 データセットにおいて最先端の性能を達成する、学習不要かつクラス非依存な異常セグメンテーションパイプラインである SuperADD を提案する。

原著者: Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer

公開日 2026-05-15✓ Author reviewed
📖 1 分で読めます☕ さくっと読める

原著者: Lukas Roming, Felix Lehnerer, Jonas V. Funk, Andreas Michel, Georg Maier, Thomas Längle, Jürgen Beyerer

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 これは以下の論文のAI生成解説です。著者が執筆したものではありません。技術的な正確性については原論文を参照してください。 免責事項の全文を読む

巨大な工場の品質管理責任者になったと想像してください。あなたの仕事は、コンベアベルトを流れる製品に微小な欠陥を見つけることです。通常、あなたは完璧な製品を数千点研究してきた専門家チームを率いています。彼らは、完璧な「壁用コンセント」や「布地」、あるいは「ジャムの瓶」がどのように見えるべきかを正確に知っています。もし、その完璧な記憶と一致しないものが見つかれば、それを欠陥としてマークします。

しかし、問題があります。工場の照明は絶えず変化しているのです。時には明るく、時には暗く、時には影が奇妙に伸びます。これにより専門家たちは混乱します。なぜなら、同じ完璧な製品でも、照明が変われば異なるように見えるからです。実際には単なる影なのに「欠陥だ!」と叫んでしまうかもしれませんし、もっと悪いことに、光が欠陥を隠しているために、本当のひび割れを見逃してしまうかもしれません。

この論文は、まさにこの問題を解決するために設計された、超スマートな新システム「SuperADD」を発表します。その仕組みを、簡単な概念に分解して説明します。

1. 「トレーニング不要」の超能力

ほとんどの AI システムは、各特定の製品に対して欠陥がどのようなものかを学ぶために、何ヶ月も教室で勉強する必要がある生徒のようです。新しい製品を導入したり、照明を変えたりすれば、彼らを学校に戻してすべてを再学習させる必要があります。

SuperADDは異なります。それは事前に特定の製品を勉強する必要がない探偵のようなものです。これは、インターネットから数百万枚の画像をすでに学習済みの事前学習済み「脳」(DINOv3と呼ばれる)を使用します。これにより、「正常」なテクスチャや形状が一般的にどのように見えるかを理解しています。新しい工場ラインごとに再学習する必要がないため、即座に導入できます。これは「プラグ&プレイ」型のソリューションです。

2. 「メモリバンク」戦略

システムは、完璧な画像をすべて記憶しようとする代わりに、メモリバンクを構築します。

  • 完璧な壁用コンセントの写真を撮影したと想像してください。
  • システムはその写真を数千の小さなパズルのピース(パッチ)に分割します。
  • それらのピースの「本質」を巨大な図書館(メモリバンク)に保存します。
  • 新しい製品がラインを流れてくると、システムはそれを同じパズルのピースに分割し、次のように問いかけます:「このピースに、私の図書館内で完璧に一致するものはあるか?」
  • もしピースが図書館内の任何东西と一致しなければ、それは奇妙なもの(異常)としてマークされます。

3. 「重なり合うパズル」のトリック

このシステムの元のバージョンには問題がありました。それは、製品を重なり合わない大きなブロックで見ていたのです。もし欠陥がたまたま 2 つのブロックの境界線上に位置した場合、システムは見逃したり混乱したりする可能性があります。まるで本の背表紙で半分に切られた単語を読もうとしているようなものです。

SuperADDは、重なり合うパッチを使用することでこれを修正します。製品をスライドする窓を通して見るようなものだと想像してください。ただし、その窓は非常に大きく、前の視界と重なり合っています。これにより、欠陥がどこにあっても、複数の角度から明確に捉えることができ、システムの信頼性が大幅に向上します。

4. 「照明シミュレーター」

変化する工場照明に備えるため、システムはトレーニング写真をそのまま見るだけではありません。セットアップ段階で、画像を人工的に暗くしたり明るくしたりします。まるで、テストの練習のために暗い部屋、明るい部屋、そして点滅する照明のある部屋で勉強しているようなものです。これにより、システムは照明の変化を無視し、製品の実際の形状とテクスチャのみに焦点を当てるように訓練されます。

5. 「形態学的クロージング」(接着剤)

時には、システムが欠陥を検知しても、その結果が連続した傷ではなく、破れた点線のように見えることがあります。まるで車の傷を見ているのに、中央部分だけがハイライトされているようなものです。

これを修正するため、SuperADD は形態学的クロージングというステップを使用します。これを魔法の接着剤だと考えてください。それは、破れた点線のハイライトを見て、点を優しくつなぎ合わせ、固体で滑らかな形状を形成します。また、欠陥領域内の小さな穴も埋め、最終的なレポートに問題の完全でクリーンな画像が表示されるようにします。

結果

このシステムは、光沢のある金属缶、透明な瓶、米の山など、厄介なアイテムを含むMVTec AD 2というデータセットを使用した、過酷なコンテスト(VAND 4.0 Industrial Track)でテストされました。

  • 課題: テストデータはトレーニングデータとは異なる照明条件を持っており、システムはすべての異なる種類のオブジェクトに対して、同じ設定(各オブジェクトごとのカスタム調整なし)で動作しなければなりませんでした。
  • 結果: SuperADD が優勝しました。すべての競合他社の中で最高得点を達成しました。
    • 布地の欠陥を約 88% の確率で正確に識別しました。
    • の欠陥を約 74% の確率で正確に識別しました。
    • 最も重要なのは、これまでの最良の方法を凌駕し、素晴らしい結果を得るために、すべての製品ごとに複雑でカスタム学習された AI を必要としないことを証明したことです。

まとめ

SuperADDは、すべての新しい製品や照明の変化に対して AI を再学習させることなく、工場の欠陥を素早く、柔軟に、かつスマートに検出する方法です。これは、事前学習された脳を使用し、詳細を見逃さないように製品を重なり合うピースで観察し、頑強さを保つために人工的な照明変化で練習し、最終的な欠陥マップがクリーンで完全であることを保証するために「接着剤」を使用します。これは、実際に非常に良くフィットする「万能」ソリューションです。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →