LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

この論文は、言語 3D ガウススプラッティングメモリを活用して、多モーダルなオープンボキャブラリー目標クエリと複数目標の視覚ナビゲーションを効率的に実現する「LagMemo」を提案し、新規に作成した GOAT-Core データセットを用いた実験で最先端の手法を大幅に上回る性能を示したことを報告しています。

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SAGE: Structure-Aware Generative Video Transitions between Diverse Clips

本論文は、線形ブレンドや既存の生成手法では困難であった多様なクリップ間の滑らかな遷移を実現するため、アートのワークフローから着想を得て構造情報と生成合成を組み合わせ、微調整なしに高品質な中間フレームを生成するゼロショット手法「SAGE」を提案し、定量的・定性的な評価で既存手法を上回る性能を示したものです。

Mia Kan, Yilin Liu, Niloy Mitra2026-03-10💻 cs

MobiDock: Design and Control of A Modular Self Reconfigurable Bimanual Mobile Manipulator via Robotic Docking

本論文は、コンピュータビジョンとねじロック機構を用いた自律ドッキングにより、2 台の独立した移動マニピュレータを物理的に結合して単一の二腕移動マニピュレータ「MobiDock」を構成し、複雑な協調制御を単純化するとともに、動的安定性と作業効率を大幅に向上させることを提案・実証したものである。

Xuan-Thuan Nguyen, Khac Nam Nguyen, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Hoang Hiep Ly, Tung D. Ta2026-03-10💻 cs

Vectorized Online POMDP Planning

本論文は、部分的観測マルコフ決定過程(POMDP)のオンライン計画問題を、依存関係や同期のボトルネックを排除して完全にベクトル化された計算で解決する新しい並列ソルバ「VOPP」を提案し、既存の並列ソルバより 20 倍、逐次ソルバより 1000 倍少ない計算予算で近最適解を効率的に導出できることを示しています。

Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati2026-03-10💻 cs

Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

この論文は、拡散モデルによる画像の「再構成時の挙動(拡散スナップバック)」を分析することで、人間の目や従来の手法では判別が困難な高品質な AI 生成画像を、圧縮やノイズなどの歪みにも強く、極めて高い精度(AUROC 0.993)で検出する新しいフォレンジック手法を提案しています。

Mohd Ruhul Ameen, Akif Islam2026-03-10💻 cs

MUGSQA: Novel Multi-Uncertainty-Based Gaussian Splatting Quality Assessment Method, Dataset, and Benchmarks

本論文は、ガウススプラッティングによる3D 物体再構成の知覚品質評価課題に対し、人間の視覚行動を模倣した多距離主観評価手法と、入力データの複数の不確実性を考慮して構築された新規データセット「MUGSQA」ならびにベンチマークを提案するものである。

Tianang Chen, Jian Jin, Shilv Cai, Zhuangzi Li, Weisi Lin2026-03-10💻 cs

Counting Through Occlusion: Framework for Open World Amodal Counting

本論文は、視覚的欠損をテキストや視覚的埋め込みなどのマルチモーダルガイダンスを用いて再構築し、注意空間の一貫性を保証することで、遮蔽下での物体カウント精度を飛躍的に向上させる新しいフレームワーク「CountOCC」を提案し、複数のデータセットで最先端の結果を達成したことを報告しています。

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Think, Speak, Decide: Language-Augmented Multi-Agent Reinforcement Learning for Economic Decision-Making

本論文は、数値データと言語的推論を統合する「Think-Speak-Decide」パイプラインを採用したマルチエージェント強化学習フレームワーク「LAMP」を提案し、経済的意思決定における累積収益、頑健性、解釈可能性を大幅に向上させることを実証しています。

Heyang Ma, Qirui Mi, Qipeng Yang, Zijun Fan, Bo Li, Haifeng Zhang2026-03-10💻 cs

Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning

この論文は、離散化されたグリッド表現の限界を克服し、連続的な物体境界座標を用いてメトリックに基づく空間レイアウトを再構築するフレームワーク「Video2Layout」を提案し、これにより空間推論タスクの精度を向上させることを示しています。

Yibin Huang, Wang Xu, Wanyue Zhang, Helu Zhi, Jingjing Huang, Yangbin Xu, Yangang Sun, Conghui Zhu, Tiejun Zhao2026-03-10💻 cs

Multi-Order Matching Network for Alignment-Free Depth Super-Resolution

本論文は、RGB-D センサの物理的制約や較正ドリフトによるアライメント誤差に頑健であり、多次数マッチングと多次数集約機構を備えた「Multi-Order Matching Network (MOMNet)」を提案することで、アライメント不要な深度超解像において最先端の性能と優れた頑健性を達成することを示しています。

Zhengxue Wang, Zhiqiang Yan, Yuan Wu, Guangwei Gao, Xiang Li, Jian Yang2026-03-10💻 cs

Radiative-Structured Neural Operator for Continuous and Extrapolative Spectral Super-Resolution

この論文は、物理的制約を考慮した連続的なスペクトルマッピングを学習し、非凸最適化に基づく角度一貫性射影(ACP)を用いて物理的に整合性のある高解像度分光画像を復元する「放射構造ニューラルオペレーター(RSNO)」を提案し、その有効性を理論的・実験的に検証したものである。

Ziye Zhang, Bin Pan, Zhenwei Shi2026-03-10💻 cs

UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors

本論文は、既知の劣化モデルに依存せず、多粒度劣化認識モジュールと潜在拡散モデルに基づく劣化耐性プロキシステップを組み合わせた「UnfoldLDM」を提案し、ブラインド画像復元における過平滑化バイアスを解消して高品質な復元を実現する手法を提示しています。

Chunming He, Rihan Zhang, Zheng Chen, Bowen Yang, Chengyu Fang, Yunlong Lin, Yulun Zhang, Fengyang Xiao, Sina Farsiu2026-03-10💻 cs

Stable Multi-Drone GNSS Tracking System for Marine Robots

本論文は、海面下で GNSS 信号が受信できない marine ロボットに対し、複数のドローンによる視覚検出、GNSS 三角測量、および信頼度重み付き拡張カルマンフィルタを統合したリアルタイム安定追跡システムを提案し、ドローン間の追跡 ID 整合アルゴリズムによるグローバル一貫性を確保することで、複雑な環境下でも高精度かつロバストな追跡を実現することを示しています。

Shuo Wen, Edwin Meriaux, Mariana Sosa Guzmán, Zhizun Wang, Junming Shi, Gregory Dudek2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

本論文は、大規模モデルの推論能力を活用して「都市 - 地区 - グリッド」の階層構造を計画し、ユーザー定義と無限の拡張を可能にする自律的な 3D 都市生成フレームワーク「Yo'City」を提案し、その卓越した性能を実証するものです。

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

DOPD: A Dynamic PD-Disaggregation Architecture for Maximizing Goodput in LLM Inference Serving

本論文は、LLM 推論におけるプリフィルとデコードステージ間の負荷不均衡を解消し、SLO 遵守を維持しつつシステムスループットを最大化するために、リアルタイム負荷監視に基づいて動的にインスタンス割当を最適化する「DOPD」というアーキテクチャを提案し、既存手法と比較して大幅な性能向上を実証したものである。

Junhan Liao, Minxian Xu, Wanyi Zheng, Yan Wang, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs