Preference-Conditioned Multi-Objective RL for Integrated Command Tracking and Force Compliance in Humanoid Locomotion

この論文は、人間の操作に対する力への追従性と指令追跡性のバランスをユーザーの好みに応じて動的に調整できる、優先度条件付き多目的強化学習フレームワークを提案し、シミュレーションおよび実機実験によりその有効性を検証したものである。

Tingxuan Leng, Yushi Wang, Tinglong Zheng, Changsheng Luo, Mingguo Zhao2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

本論文は、視覚言語行動(VLA)モデルに対して、少量のデータ汚染と視覚トリガーを用いて、タスク性能を維持したまま特定の安全上重要な動作を強制的に実行させる「DropVLA」と呼ばれる、動作レベルのバックドア攻撃手法を提案し、その物理世界での有効性を検証したものである。

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

本論文は、オフラインデータセットで学習された潜在空間の世界モデルとモデル予測制御(MPC)を組み合わせ、人間のデモンストレーションなしで物理的接触を活用したヒューマノイドロボットのリアルタイムかつロバストな動作計画を実現するフレームワークを提案しています。

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

Unsupervised Deep Generative Models for Anomaly Detection in Neuroimaging: A Systematic Scoping Review

本論文は、2018 年から 2025 年にかけて脳 MRI 画像の異常検出に応用された教師なし深生成モデルに関する 33 件の研究を体系的にレビューし、その潜在的可能性と方法論的な課題、そして今後の臨床的有用性を高めるための新たな方向性を明らかにしたものである。

Youwan Mahé, Elise Bannier, Stéphanie Leplaideur, Elisa Fromont, Francesca Galassi2026-03-10💻 cs

Taming Modality Entanglement in Continual Audio-Visual Segmentation

本論文は、音声と視覚の連続学習におけるモダリティの干渉を解決するため、マルチモーダルなサンプル選択と衝突に基づくリハーサル機構を組み合わせた新しいフレームワークを提案し、音声誘導型の連続オーディオ・ビジュアルセグメンテーションタスクにおける性能向上を実証しています。

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

PolyJailbreak: Cross-Modal Jailbreaking Attacks on Black-Box Multimodal LLMs

この論文は、マルチモーダル大規模言語モデル(MLLM)における「マルチモーダルな安全性の非対称性」という新たな脆弱性を発見し、これを構造化された原子戦略プリミティブと強化学習に基づく多エージェント最適化を活用して、GPT-4o や Gemini などの商用モデルを含む黒箱モデルに対して既存手法を大幅に上回る攻撃成功率(平均 18.15% 向上、95% 超)を達成する新しいブラックボックス・ジェイルブレイクフレームワーク「PolyJailbreak」を提案するものである。

Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Guangquan Xu, Shouling Ji2026-03-10💻 cs

HumanHalo - Safe and Efficient 3D Navigation Among Humans via Minimally Conservative MPC

この論文は、人間の動的挙動をデータ駆動モデルで予測し、到達可能性に基づく安全性の保証を初期制御入力に限定することで、人間との 3 次元空間における安全かつ効率的なマイクロ航空機(MAV)のナビゲーションを実現するモデル予測制御(MPC)フレームワーク「HumanMPC」を提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。

Simon Schaefer, Helen Oleynikova, Sandra Hirche, Stefan Leutenegger2026-03-10💻 cs

Khelte Khelte Shikhi: A Proposed HCI Framework for Gamified Interactive Learning with Minecraft in Bangladeshi Education Systems

本論文は、インターネットや電力、ハードウェアが不足するバングラデシュの教育環境の制約を克服し、Minecraft を活用したゲーミフィケーション学習を可能にするための、3 つの展開階層とローカライズされたカリキュラムを提案する HCI 枠組みを提示しています。

Mohd Ruhul Ameen, Akif Islam, Momen Khandokar Ope2026-03-10💻 cs

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

本論文は、自律走行の知覚タスクにおける合成データの有用性を検証し、3D 資産を駆使して多視点のコーナーケースを大規模に生成する新たなフレームワーク「Dream4Drive」と大規模 3D アセットデータセット「DriveObj3D」を提案し、下流の知覚モデルの性能向上を実証しています。

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

Next Generation Cloud-native In-Memory Stores: From Redis to Valkey and Beyond

本論文は、Kubernetes 環境における Valkey、KeyDB、Garnet の Redis 代替候補をベンチマークし、スループットやレイテンシ、リソース効率、移行の複雑さ、そしてコミュニティの持続性などの観点から、それらのパフォーマンスと将来性を包括的に評価したものである。

Carl-Johan Fauvelle Munck af Rosensch"old, Feras M. Awaysheh, Ahmad Awad2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

本論文は、非専門家でも自然言語で分析意図を伝え、構造化されたリスク証拠を検証し、追跡可能な専門家スタイルの推論を得られるよう、ルール抽象化・証拠スコアリング・専門家風正当化の 3 つの役割を統合した人間中心のマルチエージェントシステム「HCLA」を提案し、暗号資産取引の異常検知において、ブラックボックスモデルの解釈ではなく、規制や調査判断に整合する追跡可能な推論プロセスの再構築を通じて、説明可能性を超えた説明責任と透明性の実現を目指すものである。

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

AnyPcc: Compressing Any Point Cloud with a Single Universal Model

この論文は、多様なデータ密度に対する堅牢なコンテキストモデルと、分布外データへの効率的な適応を可能にするインスタンス適応型微調整戦略を導入した汎用点雲圧縮フレームワーク「AnyPcc」を提案し、15 の多様なデータセットにおいて新たな最先端性能を達成したことを示しています。

Kangli Wang, Qianxi Yi, Yuqi Ye, Shihao Li, Wei Gao2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

本論文は、自己教師あり学習に基づくビジョン基盤モデル DINOv2 を用いたトランスフォーマーフレームワーク「CountFormer」を提案し、例示なしの物体数え上げにおいて視覚的反復や構造の学習がどのように改善されるかを検証し、FSC-147 ベンチマークで競争力のある性能を示すとともに、表現の質が数え上げ精度に重要であることを明らかにしています。

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

この論文は、言語 3D ガウススプラッティングメモリを活用して、多モーダルなオープンボキャブラリー目標クエリと複数目標の視覚ナビゲーションを効率的に実現する「LagMemo」を提案し、新規に作成した GOAT-Core データセットを用いた実験で最先端の手法を大幅に上回る性能を示したことを報告しています。

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SAGE: Structure-Aware Generative Video Transitions between Diverse Clips

本論文は、線形ブレンドや既存の生成手法では困難であった多様なクリップ間の滑らかな遷移を実現するため、アートのワークフローから着想を得て構造情報と生成合成を組み合わせ、微調整なしに高品質な中間フレームを生成するゼロショット手法「SAGE」を提案し、定量的・定性的な評価で既存手法を上回る性能を示したものです。

Mia Kan, Yilin Liu, Niloy Mitra2026-03-10💻 cs

MobiDock: Design and Control of A Modular Self Reconfigurable Bimanual Mobile Manipulator via Robotic Docking

本論文は、コンピュータビジョンとねじロック機構を用いた自律ドッキングにより、2 台の独立した移動マニピュレータを物理的に結合して単一の二腕移動マニピュレータ「MobiDock」を構成し、複雑な協調制御を単純化するとともに、動的安定性と作業効率を大幅に向上させることを提案・実証したものである。

Xuan-Thuan Nguyen, Khac Nam Nguyen, Ngoc Duy Tran, Thi Thoa Mac, Anh Nguyen, Hoang Hiep Ly, Tung D. Ta2026-03-10💻 cs