GloSplat: Joint Pose-Appearance Optimization for Faster and More Accurate 3D Reconstruction

本論文は、3D ガウススプラッティングの学習中に SfM 特徴量トラックを明示的に維持し、フォトメトリック勾配と幾何学的な再投影損失を組み合わせることで、姿勢と外観を同時に最適化し、COLMAP 不要かつ高精度な 3D 再構築を実現する「GloSplat」というフレームワークを提案しています。

Tianyu Xiong, Rui Li, Linjie Li + 1 more2026-03-06💻 cs

On Multi-Step Theorem Prediction via Non-Parametric Structural Priors

本論文は、推論深度の増加に伴う性能低下(構造ドリフト)という課題に対し、歴史的解決手順から導出された定理先行グラフを用いて探索空間を構造化し、勾配なしで FormalGeo7k ベンチマークにおいて最先端の精度を達成するトレーニング不要の定理予測手法を提案するものである。

Junbo Zhao, Ting Zhang, Can Li + 3 more2026-03-06🤖 cs.AI

SURE: Semi-dense Uncertainty-REfined Feature Matching

本論文は、特徴類似性のみへの依存による過信エラーを解決するため、不確実性(アレイタロアとエピステミック)をモデル化して対応点とその信頼性を同時に予測する半密な特徴マッチングフレームワーク「SURE」を提案し、既存の半密マッチングモデルを精度と効率の両面で上回ることを示しています。

Sicheng Li, Zaiwang Gu, Jie Zhang + 3 more2026-03-06💻 cs

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

この論文は、放送映像からの単眼 3 次元ポーズシーケンスのみを用いて、11 万 9 千以上のプロ野球投手のデータから 8 種類の球種を 80.4% の精度で予測する解釈可能なモデルを提案し、上肢の運動が予測に最も寄与することや、グリップの違い(4 シームと 2 シーム)は姿勢からは区別できないことを明らかにしたものである。

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

Structure Observation Driven Image-Text Contrastive Learning for Computed Tomography Report Generation

本論文は、CT 画像と所見レポートの構造対応関係を学習するための構造観測駆動型画像・テキスト対照学習フレームワークを提案し、2 段階の学習プロセスと偽陰性低減手法により、既存手法を超える最先端の CT 所見生成性能を達成したことを報告しています。

Hong Liu, Dong Wei, Qiong Peng + 4 more2026-03-06💻 cs

DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization

本論文は、可変受容野とリレートークン機構を導入して長期依存関係のモデル化と希薄な偽造検出の感度を向上させた変形可能状態空間モデル「DeformTrace」を提案し、動画・音声の時間的偽造局所化において最先端の性能を達成することを示しています。

Xiaodong Zhu, Suting Wang, Yuanming Zheng + 5 more2026-03-06🤖 cs.AI

Federated Modality-specific Encoders and Partially Personalized Fusion Decoder for Multimodal Brain Tumor Segmentation

この論文は、多モーダル画像のモダリティ欠損と個人差という 2 つの課題を解決するため、モダリティ固有のエンコーダを連合学習し、局所データ特性に応じて部分的にパーソナライズされたデコーダを採用する新たな連合学習フレームワーク「FedMEPD」を提案し、脳腫瘍セグメンテーションタスクにおいて既存手法を上回る性能を実証したものである。

Hong Liu, Dong Wei, Qian Dai + 3 more2026-03-06💻 cs

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

本論文は、マルチモーダル連合学習におけるモダリティやタスクの不一致、モデルの異質性といった課題を解決するため、クライアント側で双層敵対的整合と粒度認識型融合を採用し、サーバー側で類似性に基づくアンサンブル蒸留を行う統合フレームワーク「FedAFD」を提案し、その優れた性能を実証したものである。

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

TimeWarp: Evaluating Web Agents by Revisiting the Past

本論文は、Web の進化に伴う UI やレイアウトの変化に対するエージェントの脆弱性を評価するベンチマーク「TimeWarp」を提案し、複数のバージョンにわたる軌跡を教師データとして活用する「TimeTraj」というアルゴリズムにより、エージェントの汎化性能と頑健性を大幅に向上させることを示しています。

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

Location-Aware Pretraining for Medical Difference Visual Question Answering

本論文は、放射線科医の比較診断ワークフローを模倣し、病状の進行と画像取得の違いを区別するために、自動参照表現やグラウンディングキャプションなどの位置情報に配慮した事前学習タスクを導入することで、胸部 X 線画像の差分視覚的質問応答(VQA)において最先端の性能を達成するフレームワークを提案しています。

Denis Musinguzi, Caren Han, Prasenjit Mitra2026-03-06🤖 cs.AI

Revisiting an Old Perspective Projection for Monocular 3D Morphable Models Regression

本論文は、ヘッドマウントカメラなどで撮影された近接映像におけるパースペクティブ歪みを効果的に捉えるため、従来の正射投影モデルに擬似パースペクティブ効果をもたらす新しい縮小パラメータを導入し、既存の 3D モデルを微調整可能にした新しいカメラモデルを提案するものである。

Toby Chong, Ryota Nakajima2026-03-06💻 cs