Image Compression Using Novel View Synthesis Priors
本論文は、事前のミッション情報とニューラルビュー合成モデルを活用し、勾配降下法で潜在表現を最適化することで、水中 ROV の帯域幅制限下でも高品質な画像伝送を可能にする新たな画像圧縮手法を提案し、人工海洋水槽での実験により既存手法を上回る圧縮率と画質、および新規物体への頑健性を実証したものである。
93 件の論文
本論文は、事前のミッション情報とニューラルビュー合成モデルを活用し、勾配降下法で潜在表現を最適化することで、水中 ROV の帯域幅制限下でも高品質な画像伝送を可能にする新たな画像圧縮手法を提案し、人工海洋水槽での実験により既存手法を上回る圧縮率と画質、および新規物体への頑健性を実証したものである。
この論文は、MIMO レイリーフェージングチャネルにおいて、チャネル状態情報と信号対雑音比をエンコーダ・デコーダに統合し、エントロピーに基づく適応レート制御と多モーダル大規模言語モデル(MLLM)を用いた特徴量補償を組み合わせることで、通信効率とタスク性能の両立を実現する新しい意味通信フレームワークを提案するものである。
この論文は、衛星画像における船舶検出の課題である極端なスケール差とアスペクト比に対処するため、検出ピラミッドレベルを P3-P5 から P2-P4 へシフトさせ、グループ正規化を用いた補助ブランチを統合した軽量かつ高精度な検出器「LiM-YOLO」を提案し、主要なベンチマークで最先端の性能を達成したことを報告しています。
本論文は、中性原子アナログ量子コンピュータを用いて、古典的な前処理で抽出した画像の幾何学情報を物理的に符号化し、量子状態の静的構造因子などの観測量から得られる「量子指紋」を用いて画像マッチングを実現する革新的なフレームワークを提案するものである。
本論文は、臨床現場で利用可能な外部ガイダンスに依存せず、生成モデル自身が欠損状態を自己認識して推論する「CoPeDiT」という新しい 3D MRI 合成フレームワークを提案し、欠損モダリティやスライスの補完において最先端の手法を上回る高忠実度かつ構造的に整合性の高い結果を実現したことを報告しています。
この論文は、雲や煙による観測データの欠損という課題に対処するため、欠損部分の復元と時空間予測を分離した二段階の確率的フレームワークを提案し、特に MaskCVAE や MaskUNet を用いた復元段階を挟むことで、汚染された入力条件下でも高精度な野火の予測が可能になることを示しています。
本論文は、MRI と低線量 PET スキャンを個別に処理してモダリティ固有の特徴を学習し、階層的な特徴融合を通じて高品質な標準線量 PET 画像を再構成する多モダリティ多タスク拡散モデル「M2Diff」を提案し、健常者およびアルツハイマー病患者のデータセットにおいてその有効性を実証したものである。
この論文は、CNN とトランスフォーマーのそれぞれが抱える局所・大域ノイズの課題を解決するため、ピラミッド型ビジョントランスフォーマーと動的変化焦点モジュールを統合した「DFPF-Net」を提案し、複数のデータセットで既存手法を上回る遠隔 sensing 変化検出性能を実証したものである。
この論文は、メタサーフェスと屈折光学系を組み合わせた新しいアセンブリを採用し、単一ショットで広帯域(可視光全域)のハイパースペクトル画像と HDR または偏光画像を同時に取得可能な、超小型で高精度なカメラ「MetaSpectra+」を提案するものである。
この論文は、広視野・高ダイナミックレンジの条件に対応するパッチ単位の学習と非線形変換を導入して改良した深層学習モデル「POLISH」を提案し、シミュレーションデータを用いた検証により、従来の CLEAN 法に比べて重力レンズ発見の感度が 10 倍向上することを示しています。
大規模な肺癌スクリーニングコホートにおける低線量 CT による PPFE の量的変化を分析した本研究は、PPFE の進行が死亡率の上昇や呼吸器関連の悪性転帰と独立して強く関連していることを明らかにし、PPFE の進行を定量的に評価することがスクリーニングプログラム内の呼吸器リスクの高い個人を特定するための臨床的に有用な画像バイオマーカーとなり得ると結論付けています。
この論文は、動画編集における背景の整合性と前景の品質向上という課題に対し、拡散モデルの「ハルシネーション(幻覚)」を検知して動的にキー・バリューの融合比率と CFG スケールを調整する学習不要なフレームワーク「KV-Lock」を提案し、既存手法を上回る結果を示しています。
この論文は、現実世界の自動運転において頻発するマルチカメラ入力の欠損に対処し、マルチビューマスク再構成と特徴量メモリモジュールを組み合わせることで、不完全な観測条件下でも堅牢な3Dセマンティックオキュパンシー予測を実現するフレームワーク「-Occ」を提案し、nuScenes ベンチマークにおいて大幅な性能向上を実証したものである。
本論文は、360 度室内環境における物体中心かつ視点に依存した既存の限界を克服し、歪み感知スペクトル変調やオムニ球状高密度化ヘッドを備えた「PanoAffordanceNet」フレームワークと、初の高品質パノラマアフォーダンス接地データセット「360-AGD」を提案することで、エンボディドエージェントのための包括的な環境知覚を実現するものです。
CycleULM は、ラベル付きデータや高忠実度シミュレータを必要とせず、物理モデルを模倣した翻訳学習を通じて超音波局在化顕微鏡(ULM)の解像度・精度・処理速度を大幅に向上させ、臨床応用への実用的な道筋を示す初の統一型ラベルフリー深層学習フレームワークです。
CLIP などの事前学習済み基盤モデルを活用してオンラインで視覚的プロンプトを自動生成・更新し、対照的なガイダンスを通じて不要な対象を抑制することで汎用オブジェクトトラッキングの性能を向上させる新しい手法「PiVOT」を提案する論文です。
本論文は、事前学習された無条件拡散モデルを条件付き生成タスクに応用するため、ベイズの定理に基づき条件付きスコア関数を無条件スコアとガイダンス項に分解し、自然画像のガウス型事前分布を組み込んだ最大事後確率(MAP)に基づく新たなガイダンス項推定法を提案することで、逆問題の解像度向上や画像修復において既存手法よりも内容の保存性や一貫性を高める手法を提示しています。
本研究は、BraTS データセットの多モーダル MRI 画像を前処理し、2D と 3D の UNET によるセグメンテーション結果を重み付き平均で融合して ResNet50 に投入する手法を提案し、99.25% の分類精度を達成することで、グリオーマのサブクラス分類の精度を大幅に向上させたことを示しています。
この論文は、UNet、Inception、ResNet アーキテクチャに基づき、2D と 3D 畳み込みの長所をバランスさせた深層学習モデルを提案し、BraTS データセットを用いた検証で Glioma の自動セグメンテーションにおいて高い精度(3D で Dice 0.9888、2D で 0.8312)を達成したことを報告しています。
この論文は、解剖学的ランドマークを組み込んだトランスフォーマーベースの幾何学的深層学習モデルを提案し、侵襲的で高価なPETスキャンに頼らずにアルツハイマー病の診断精度を向上させ、中リスク群における脳アミロイド陽性性の予測を可能にするものである。