FoldNet: Learning Generalizable Closed-Loop Policy for Garment Folding via Keypoint-Driven Asset and Demonstration Synthesis

本論文は、キーポイント駆動のアセット合成と KG-DAgger による失敗回復用デモンストレーション生成を活用し、15 万の軌跡を用いた閉ループ模倣学習によって、実世界で 75% の成功率を達成する汎用的な衣類折り畳みロボット制御ポリシーを提案する。

Yuxing Chen, Bowen Xiao, He Wang2026-03-10💻 cs

Diffusion-SAFE: Diffusion-Native Human-to-Robot Driving Handover for Shared Autonomy

本論文は、拡散モデルに基づく評価器と安全ガイド付きコパイロットを統合し、人間の意図と安全な制御を連続的に調整する「Diffusion-SAFE」を提案し、シミュレーションおよび実車実験において高いハンドオーバー成功率と滑らかな制御遷移を実現したことを報告しています。

Yunxin Fan, Monroe Kennedy III2026-03-10💻 cs

MTVCraft: Tokenizing 4D Motion for Arbitrary Character Animation

本論文は、従来の 2D ポーズ画像に依存せず、3D 運動シーケンスを直接モデル化する「4DMoT」と「MV-DiT」を導入した MTVCraft を提案し、任意のキャラクターや非人間オブジェクトに対する高精度かつ汎用性の高いゼロショット動画生成を実現したことを報告しています。

Yanbo Ding, Xirui Hu, Zhizhi Guo, Yan Zhang, Xinrui Wang, Zhixiang He, Chi Zhang, Yali Wang, Xuelong Li2026-03-10💻 cs

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

この論文は、金融専門家 34 名を対象とした実証研究を通じて、AI 支援作業における「余分な認知負荷」が作業品質に最も大きな悪影響を与え、特に経験の浅い専門家がその負荷によるペナルティを大きく受ける一方で AI 生成コンテンツからの恩恵も大きいことを明らかにした。

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew Beane2026-03-10💻 cs

Power flow and optimal power flow using quantum and digital annealers: a computational scalability analysis

本研究は、電力潮流および最適電力潮流問題を離散組み合わせ最適化問題として定式化する新しい量子・デジタル・アニーリング手法(AQPF/AQOPF)を提案し、D-Wave 社や富士通社のハードウェアを用いた大規模システムでの検証を通じて、その実現可能性とスケーラビリティを実証しています。

Zeynab Kaseb, Matthias Moller, Pedro P. Vergara, Peter Palensky2026-03-10💻 cs

Representing local protein environments with machine learning force fields

本論文は、原子レベルの基盤モデルから得られる中間特徴量を用いた局所タンパク質環境の新しい表現手法を提案し、これが二次構造や化学的特性を効果的に捉えるだけでなく、NMR 化学シフトの予測において最先端の精度を達成する物理情報に基づく予測器の構築を可能にしたことを示しています。

Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Anar Rzayev, Federico Napoli, Paul Schanda, Alex M. Bronstein2026-03-10💻 cs

Assigning Multi-Robot Tasks to Multitasking Robots

この論文は、単一タスクという仮定に依存する既存手法の限界を克服し、マルチタスクロボットが物理的制約を考慮して複数のタスクを同時に実行できる新しいタスク割り当てフレームワークを提案し、MAX-SAT 編成と貪欲ヒューリスティックによる効率的な解決策を、シミュレーションおよび実機実験を通じて検証するものである。

Winston Smith, Yu Zhang2026-03-10💻 cs

Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning

本論文は、LLM の常識推論と古典的計画を融合させ、3D 環境における目標の文脈に応じた段階的な緩和(ゴール・リラクゼーション)を実現する「ContextMatters」を提案し、これにより未達成になりがちなタスクの成功率を大幅に向上させ、実世界ロボットでの実行も可能にしたことを示しています。

Emanuele Musumeci, Michele Brienza, Francesco Argenziano, Abdel Hakim Drid, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi2026-03-10💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

本論文は、ピラミッド型 pix2pix の損失関数に分散ペナルティを導入してモード崩壊を抑制し、H&E 染色画像から高忠実度の HER2 免疫組織化学画像を生成する深層学習フレームワークを提案することで、乳がん診断の精度向上とコスト削減を実現するものである。

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung Nam2026-03-10💻 cs

Light of Normals: Unified Feature Representation for Universal Photometric Stereo

本論文は、照明と法線ベクトルを明確に分離する「Light Register トークン」や「Wavelet 基盤の双枝アーキテクチャ」を提案し、大規模合成データセット「PS-Verse」を用いたカリキュラム学習を通じて、任意の照明条件下で高精度かつ汎用的なフォトメトリックステレオを実現する「LINO UniPS」を構築したものである。

Houyuan Chen, Hong Li, Chongjie Ye + 11 more2026-03-10💻 cs

Open-Vocabulary Camouflaged Object Segmentation with Cascaded Vision Language Models

本論文は、視覚言語モデル(VLM)から得られる特徴を明示的なプロンプトとしてセグメンテーションモデル(SAM)に活用し、さらに分類段階でドメインギャップを回避する「ソフトな空間事前分布」を導入するカスケード型フレームワークを提案することで、任意のクラスの擬態物体を高精度にセグメント化・分類するオープンボキャブラリ擬態物体セグメンテーション(OVCOS)の課題を解決するものです。

Kai Zhao, Wubang Yuan, Zheng Wang, Guanyi Li, Xiaoqiang Zhu, Deng-ping Fan, Dan Zeng2026-03-10💻 cs

SUBARU: A Practical Approach to Power Saving in Hearables Using SUB-Nyquist Audio Resolution Upsampling

本論文は、サブ・ナイキストサンプリングと低ビット解像度を意図的に採用することで消費電力を 3.31 倍削減しつつ、モバイルプラットフォーム上でリアルタイムに動作する広帯域音声再構成手法「SUBARU」を提案し、ノイズ環境下での高品質な音声強調を実現する実践的なアプローチを提示しています。

Tarikul Islam Tamiti, Sajid Fardin Dipto, Luke Benjamin Baja-Ricketts, David C Vergano, Anomadarshi Barua2026-03-10💻 cs

Autonomous Vision-Aided UAV Positioning for Obstacle-Aware Wireless Connectivity

本論文は、都市環境における障害物やトラフィックをコンピュータビジョンでリアルタイムに検知し、地上ユーザーとの見通し通信を最適化する自律型ドローン位置決めアルゴリズム「VTOPA」を提案し、シミュレーションによりスループット向上と遅延削減を実証したものである。

Kamran Shafafi, Manuel Ricardo, Rui Campos2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

本論文は、複数のデータセットをまたぐ汎用的な視覚的場所認識を実現するため、学習されたクエリを参照コードブックとして活用し、計算コストを大幅に増やさずに特徴集約の能力を向上させる「クエリベース適応集約(QAA)」を提案し、既存の単一データセット特化モデルと同等の性能を維持しながら多様なデータセット間でのバランスの取れた汎化性能を達成することを示しています。

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

本論文は、センサー故障やプライバシー保護により生じる不完全なマルチモーダルデータの問題に対処するため、モダリティ組合せごとの共有情報と固有特徴を分離し、表現空間の分離性に基づいて動的に学習比率を調整する新しいパラメータ効率型学習フレームワーク「MCULoRA」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを示しています。

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Unified Medical Image Segmentation with State Space Modeling Snake

本論文は、状態空間モデルを活用した新しいディープスネークフレームワーク「Mamba Snake」を提案し、多スケールの構造的異質性や器官間の関係性を効果的にモデル化することで、医用画像の統一セグメンテーションにおいて最先端の手法を上回る性能を達成したことを示しています。

Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao2026-03-10💻 cs