OmniCT: Towards a Unified Slice-Volume LVLM for Comprehensive CT Analysis

OmniCT は、スライス駆動の局所的特徴とボリューム駆動の空間的表現を統合し、臨床的有用性を高めるための新たなパラダイムを確立する、CT 画像の包括的解析に向けた統一されたスライス - ボリューム LVLM です。

Tianwei Lin, Zhongwei Qiu, Wenqiao Zhang, Jiang Liu, Yihan Xie, Mingjian Gao, Zhenxuan Fan, Zhaocheng Li, Sijing Li, Zhongle Xie, Peng LU, Yueting Zhuang, Ling Zhang, Beng Chin Ooi, Yingda Xia

公開日 2026-03-03
📖 1 分で読めます☕ さくっと読める

Each language version is independently generated for its own context, not a direct translation.

OmniCT: 医師の「目」と「脳」を一つにした CT 画像の天才解説者

この論文は、医療用 CT スキャン(体の断面画像)を分析するための新しい AI「OmniCT(オムニ CT)」を紹介しています。

これまでの AI は、CT 画像を見る際に「2 次元の断面(スライス)」しか見られないか、「3 次元の立体(ボリューム)」しか見られないかのどちらかでした。しかし、実際の医師は、**「微細な病変を見つける鋭い目(2D)」「臓器全体のつながりや広がりを理解する立体感覚(3D)」**の両方を同時に使っています。

OmniCT は、この「2 つの視点」を一つに統合した、世界初の万能な CT 分析 AI です。

以下に、難しい専門用語を使わず、身近な例え話で解説します。


1. 従来の AI の悩み:「パズル」か「地図」か?

CT 画像は、パンを何枚も重ねたような「スライス(断面)」の集合体です。

  • 従来の「2D 型 AI」:一枚一枚のパンの断面を詳しく見て、「ここに小さなシミがある!」と見つけるのは得意ですが、「そのシミがパンのどこにあり、隣のスライスとどうつながっているか」がわからず、立体感が欠けていました。
    • 例え: 地図の「1 ページだけ」を見て、その場所が山の上なのか谷なのか、全体像がわからない状態です。
  • 従来の「3D 型 AI」:パンの山全体を立体的に把握できますが、「1 ページごとの細かいシミ」を見逃してしまったり、画像の解像度が粗すぎて、小さな病変を見つけられませんでした。
    • 例え: 全体図は見えるけれど、拡大鏡がないので、紙の小さな文字が読めない状態です。

医師は「小さな病変(2D)」と「臓器の広がり(3D)」の両方を同時に理解する必要があります。OmniCT は、この**「2D の鋭さ」と「3D の広がり」を両立させた**のが最大の特徴です。

2. OmniCT の 3 つの「超能力」

OmniCT がなぜこんなに優秀なのか、3 つの工夫(技術)で説明します。

① 空間の連続性を高める「SCE」:パンの山を「ブロック」で見る

  • 仕組み: 隣り合った数枚の断面画像を「1 つのブロック」のようにくっつけて、AI に見せます。さらに、3 次元の「位置情報(上・下・左・右・奥)」を AI の頭に注入します。
  • 例え: 単にバラバラの写真を並べるのではなく、「立体パズル」を組み立ててから、AI に見せています。これにより、AI は「このシミは 1 枚目にあるけど、2 枚目では消えている」といった、画像の連続性を自然に理解できるようになります。

② 臓器ごとの意味を深める「OSE」:重要な場所を「拡大鏡」で見る

  • 仕組み: 体には心臓、肺、肝臓など多くの臓器があります。OmniCT は、まず「どの臓器が写っているか」を自動で特定し、その部分だけを**「拡大して詳しく見る」**ように設計されています。
  • 例え: 広い公園(体全体)を歩く際、「花壇(臓器)」だけを見つめて、その中の小さな虫(病変)を探すようなイメージです。重要な場所には時間をかけ、そうでない場所は素通りする「賢い視線」を持っています。

③ 最強のテスト場「MedEval-CT」:170 万件の「模擬試験」

  • 仕組み: AI を評価するために、これまでになかった巨大なテストデータセットを作りました。170 万件以上の質問と答え、7 つの異なる医療タスク、13 の臓器を網羅しています。
  • 例え: 従来の AI 評価は「簡単なクイズ」だけでしたが、OmniCT は**「医師国家試験レベルの、あらゆる難易度の模擬試験」**で鍛え上げ、評価されました。これにより、本当に臨床現場で使えるかどうかが厳しくチェックされています。

3. 結果:医師のパートナーとして

実験の結果、OmniCT は既存のどの AI よりも優れていました。

  • 2D のテストでも 3D のテストでも、トップクラスの成績を収めました。
  • 心臓や肺だけでなく、膵臓や食道など、見つけにくい小さな臓器の病変も正確に捉えることができました。
  • 単に「病変がある」と言うだけでなく、**「どの臓器のどの部分に、どのような病気が広がっているか」**を、医師が理解できる言葉で説明できます。

まとめ

OmniCT は、「2D の拡大鏡」と「3D の全体図」を一つに融合させた、医療 AI の新しい基準です。

これまでは「2D 型 AI」と「3D 型 AI」を別々に使わないといけなかった医師も、OmniCT 一つで、**「微細な病変の発見」と「病気の全体像の把握」**を同時にこなせるようになります。これは、医療現場における AI の活用が、単なる「補助」から「不可欠なパートナー」へと進化することを示す、大きな一歩です。


プロジェクトの場所:
この研究は浙江大学とアリババグループ(DAMO アカデミー)によって行われ、コードは GitHub で公開されています。
🔗 GitHub リンク