MatPedia: A Universal Generative Foundation for High-Fidelity Material Synthesis

本論文は、RGB 画像と物理ベースレンダリング(PBR)マッピングを統合した新しい表現を用いた生成基盤モデル「MatPedia」を提案し、大規模な RGB 画像データから学習した視覚的知識を活用しながら、単一アーキテクチャで高品質かつ多様な PBR 素材の生成や分解を可能にするものです。

Di Luo, Shuhui Yang, Mingxin Yang, Jiawei Lu, Yixuan Tang, Xintong Han, Zhuo Chen, Beibei Wang, Chunchao Guo

公開日 2026-03-05
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

マトペディア(MatPedia):3D 素材の「万能辞書」を作った話

こんにちは!今日は、最新の AI 研究「MatPedia(マトペディア)」について、難しい専門用語を使わずに、わかりやすくお話しします。

🎨 従来の悩み:「素材作り」は魔法使いの修行?

まず、3D ゲームや映画の CG を想像してみてください。あのリアルな「木目」や「金属の光沢」、「布の柔らかさ」は、すべてPBR マテリアル(物理ベースレンダリング素材)というデータで作られています。

しかし、これまでこの素材を作るのは、「魔法使いの修行」のように大変でした。

  • 専門知識が必要。
  • 一つ一つ手作業で調整する必要がある。
  • 時間がかかりすぎる。

AI が画像を作る技術(拡散モデル)は進歩しましたが、これまでの AI は「見た目の画像(RGB)」と「物理的な性質(光の反射具合など)」を別々の箱で扱っていました。そのため、AI に「木を作れ」と言っても、見た目は木っぽくても、光の当たり方がおかしくなったり、逆に物理的には正しいのに見た目が変だったりして、「見た目」と「中身」がバラバラになってしまうのが課題でした。

💡 解決策:「5 枚の連続写真」というアイデア

そこで登場したのが、MatPedia(マトペディア)です。

この研究のすごいところは、「見た目の画像」と「物理的なデータ」を、まるで「連続する 5 枚の写真」のように扱ったことです。

  • 1 枚目: 普通の「見た目の画像(RGB)」
  • 2〜5 枚目: それに対応する「物理的なデータ(光の反射、凹凸、金属度など)」

これらを**「動画のフレーム**(連続した映像)のように捉えることで、AI は「見た目がこうなら、物理的な性質はこうなるはずだ」という自然なつながりを学習できるようになりました。

🏗️ 仕組みの比喩:「建築家」と「設計図」

MatPedia の仕組みを建築に例えてみましょう。

  1. 従来の AI

    • 「建物の外観写真」を作る建築家と、「配管や電気図面」を作る設計士が、全く別々のチームで働いていました。
    • 結果:外観は素敵でも、中身(配管)がズレていたり、逆に中身は完璧でも外観が変だったりします。
  2. MatPedia のアプローチ

    • 「外観写真」と「設計図」を、同じ建築家が同時に描くようにしました。
    • さらに、「動画生成 AI(映画を作る技術)の技術を流用しています。
    • 動画では「次のフレームは前のフレームと似ているはず」と学習しますが、MatPedia では「物理データは見た目に密接に関連している」と学習させることで、高品質でリアルな素材を一度に生み出せるようになりました。

🚀 できること:3 つの魔法

MatPedia は、1 つのシステムで 3 つの魔法を操ることができます。

  1. テキストから素材を作る(Text-to-Material)
    • 「光沢のある青い布」や「錆びた鉄」などと文字で言うと、AI が即座に、見た目の画像と物理データセットを生成します。
  2. 写真から素材を作る(Image-to-Material)
    • 歪んだ写真(例えば、壁に貼られたカーペットの写真)を渡すと、AI がそれを**「平らで歪みのない素材データ」**に変換してくれます。
  3. 素材を分解する(Intrinsic Decomposition)
    • 完成した 3D 画像から、AI が「これは光の反射」「これは凹凸」という物理的な要素を勝手に分解して取り出します。

📚 学習データ:「百科事典」のような大量データ

この AI を強くするために、研究者たちは**「MatHybrid-410K」**という巨大なデータセットを作りました。

  • PBR データ(物理データ付き):専門的な素材データ。
  • 普通の画像データ:インターネットにある大量の美しい写真。

これらを混ぜて学習させることで、AI は「物理データが少ない」という弱点を補い、**「普通の画像の美しさ」**を素材生成に活かせるようになりました。まるで、料理のレシピ本(PBR データ)だけでなく、世界中の美味しい料理の写真(普通の画像)も見て、より美味しく、多様な料理を作れるようになったようなものです。

🌟 成果:4K 対応の超リアル素材

MatPedia は、1024×1024(そして 4K まで拡大可能)という超高解像度で、今までにないほど多様でリアルな素材を生成できます。

  • 木目の細部までリアル。
  • 金属の光の反射が自然。
  • 布の質感が生き生きとしている。

まとめ

MatPedia は、「見た目」と「物理的な性質」を一つにまとめ、動画生成の技術を応用した、3D 素材作りのための「万能な辞書(Foundation Model)です。

これにより、ゲーム開発者やデザイナーは、専門知識がなくても、高品質な 3D 素材を簡単に作れるようになり、未来のバーチャルワールドがよりリアルで豊かになることが期待されています。

まるで、「素材の魔法使い」が、誰でも使える「魔法の杖(MatPedia)になったようなものですね!✨