Differentiable Variable Fonts

この論文は、可変フォントのパラメータとベクトルグラフィック間の微分可能な関係を確立する「微分可能可変フォント」を提案し、勾配法による最適化を通じて文字の形状操作、重なり考慮モデリング、物理ベースのアニメーション、および自動フォント設計など、直感的で自動化されたタイポグラフィワークフローを実現するものです。

Kinjal Parikh, Danny M. Kaufman, David I. W. Levin, Alec Jacobson2026-03-10💻 cs

EB-MBD: Emerging-Barrier Model-Based Diffusion for Safe Trajectory Optimization in Highly Constrained Environments

この論文は、制約の厳しい環境におけるモデルベース拡散法のサンプリング非効率性と性能劣化を、内部点法に着想を得た「出現バリア関数」を用いて段階的に制約を導入する手法(EB-MBD)により解決し、投影法に比べて計算コストを大幅に削減しつつ、2 次元および 3 次元の複雑なタスクで高品質な安全軌道最適化を実現することを提案しています。

Raghav Mishra, Ian R. Manchester2026-03-10💻 cs

Real-Time Motion-Controllable Autoregressive Video Diffusion

本論文は、強化学習と自己ロールアウト機構を組み合わせることで、リアルタイムかつ高精度な運動制御を実現し、既存の拡散モデルに比べて大幅な遅延低減と高画質を両立する初の RL 強化型少量ステップ自己回帰動画生成モデル「AR-Drag」を提案するものである。

Kesen Zhao, Jiaxin Shi, Beier Zhu, Junbao Zhou, Xiaolong Shen, Yuan Zhou, Qianru Sun, Hanwang Zhang2026-03-10💻 cs

CDE: Concept-Driven Exploration for Reinforcement Learning

本論文は、事前学習された視覚言語モデルから得られるノイズの多い概念信号を補助的な再構成タスクを通じて活用し、視覚制御タスクにおける効率的な探索を可能にする「概念駆動型探索(CDE)」を提案し、シミュレーションおよび実世界のロボットアーム操作タスクでの有効性を示しています。

Le Mao, Andrew H. Liu, Renos Zabounidis, Yanan Niu, Zachary Kingston, Joseph Campbell2026-03-10💻 cs

Deliberative Dynamics and Value Alignment in LLM Debates

この論文は、Reddit の「Am I the Asshole」コミュニティの事例を用いて大規模言語モデル(LLM)間の議論を分析し、同期・ラウンドロビンといった対話プロトコルやモデルの種類によって、意見の修正率や価値観の優先順位、および順序効果への反応に顕著な差異が生じることを明らかにしています。

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

本論文は、マルチモーダル推論モデルにおける浅い層の知覚バイアスと深い層の推論ドリフトという二つの失敗モードを特定し、学習不要の軽量プラグイン「Functional Head Identification and Class-Conditioned Rescaling」を用いて層間での注意配分を適応的に再調整することで、再学習やアーキテクチャ変更なしに推論の一貫性と視覚的忠実度を向上させる手法を提案しています。

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

Preference-Conditioned Multi-Objective RL for Integrated Command Tracking and Force Compliance in Humanoid Locomotion

この論文は、人間の操作に対する力への追従性と指令追跡性のバランスをユーザーの好みに応じて動的に調整できる、優先度条件付き多目的強化学習フレームワークを提案し、シミュレーションおよび実機実験によりその有効性を検証したものである。

Tingxuan Leng, Yushi Wang, Tinglong Zheng, Changsheng Luo, Mingguo Zhao2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

本論文は、視覚言語行動(VLA)モデルに対して、少量のデータ汚染と視覚トリガーを用いて、タスク性能を維持したまま特定の安全上重要な動作を強制的に実行させる「DropVLA」と呼ばれる、動作レベルのバックドア攻撃手法を提案し、その物理世界での有効性を検証したものである。

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

本論文は、オフラインデータセットで学習された潜在空間の世界モデルとモデル予測制御(MPC)を組み合わせ、人間のデモンストレーションなしで物理的接触を活用したヒューマノイドロボットのリアルタイムかつロバストな動作計画を実現するフレームワークを提案しています。

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

Unsupervised Deep Generative Models for Anomaly Detection in Neuroimaging: A Systematic Scoping Review

本論文は、2018 年から 2025 年にかけて脳 MRI 画像の異常検出に応用された教師なし深生成モデルに関する 33 件の研究を体系的にレビューし、その潜在的可能性と方法論的な課題、そして今後の臨床的有用性を高めるための新たな方向性を明らかにしたものである。

Youwan Mahé, Elise Bannier, Stéphanie Leplaideur, Elisa Fromont, Francesca Galassi2026-03-10💻 cs

Taming Modality Entanglement in Continual Audio-Visual Segmentation

本論文は、音声と視覚の連続学習におけるモダリティの干渉を解決するため、マルチモーダルなサンプル選択と衝突に基づくリハーサル機構を組み合わせた新しいフレームワークを提案し、音声誘導型の連続オーディオ・ビジュアルセグメンテーションタスクにおける性能向上を実証しています。

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

PolyJailbreak: Cross-Modal Jailbreaking Attacks on Black-Box Multimodal LLMs

この論文は、マルチモーダル大規模言語モデル(MLLM)における「マルチモーダルな安全性の非対称性」という新たな脆弱性を発見し、これを構造化された原子戦略プリミティブと強化学習に基づく多エージェント最適化を活用して、GPT-4o や Gemini などの商用モデルを含む黒箱モデルに対して既存手法を大幅に上回る攻撃成功率(平均 18.15% 向上、95% 超)を達成する新しいブラックボックス・ジェイルブレイクフレームワーク「PolyJailbreak」を提案するものである。

Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Guangquan Xu, Shouling Ji2026-03-10💻 cs

HumanHalo - Safe and Efficient 3D Navigation Among Humans via Minimally Conservative MPC

この論文は、人間の動的挙動をデータ駆動モデルで予測し、到達可能性に基づく安全性の保証を初期制御入力に限定することで、人間との 3 次元空間における安全かつ効率的なマイクロ航空機(MAV)のナビゲーションを実現するモデル予測制御(MPC)フレームワーク「HumanMPC」を提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。

Simon Schaefer, Helen Oleynikova, Sandra Hirche, Stefan Leutenegger2026-03-10💻 cs

Khelte Khelte Shikhi: A Proposed HCI Framework for Gamified Interactive Learning with Minecraft in Bangladeshi Education Systems

本論文は、インターネットや電力、ハードウェアが不足するバングラデシュの教育環境の制約を克服し、Minecraft を活用したゲーミフィケーション学習を可能にするための、3 つの展開階層とローカライズされたカリキュラムを提案する HCI 枠組みを提示しています。

Mohd Ruhul Ameen, Akif Islam, Momen Khandokar Ope2026-03-10💻 cs

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

本論文は、自律走行の知覚タスクにおける合成データの有用性を検証し、3D 資産を駆使して多視点のコーナーケースを大規模に生成する新たなフレームワーク「Dream4Drive」と大規模 3D アセットデータセット「DriveObj3D」を提案し、下流の知覚モデルの性能向上を実証しています。

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

Next Generation Cloud-native In-Memory Stores: From Redis to Valkey and Beyond

本論文は、Kubernetes 環境における Valkey、KeyDB、Garnet の Redis 代替候補をベンチマークし、スループットやレイテンシ、リソース効率、移行の複雑さ、そしてコミュニティの持続性などの観点から、それらのパフォーマンスと将来性を包括的に評価したものである。

Carl-Johan Fauvelle Munck af Rosensch"old, Feras M. Awaysheh, Ahmad Awad2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

本論文は、非専門家でも自然言語で分析意図を伝え、構造化されたリスク証拠を検証し、追跡可能な専門家スタイルの推論を得られるよう、ルール抽象化・証拠スコアリング・専門家風正当化の 3 つの役割を統合した人間中心のマルチエージェントシステム「HCLA」を提案し、暗号資産取引の異常検知において、ブラックボックスモデルの解釈ではなく、規制や調査判断に整合する追跡可能な推論プロセスの再構築を通じて、説明可能性を超えた説明責任と透明性の実現を目指すものである。

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs