cs 件の論文 | Gist.Science

Beyond Collision Cones: Dynamic Obstacle Avoidance for Nonholonomic Robots via Dynamic Parabolic Control Barrier Functions

この論文は、非ホロノミックロボットが動的な障害物に囲まれた環境で安全に移動できるよう、相対速度の角度だけでなく距離や速度の大きさも考慮して放物線状の安全領域を動的に調整する「動的放物線制御バリア関数（DPCBF）」を提案し、従来の衝突円錐法よりも制約が緩和され、高密度な環境でも制御問題の実行可能性と航行成功率を大幅に向上させることを実証しています。

Hun Kuk Park, Taekyung Kim, Dimitra Panagou2026-03-10💻 cs

Streaming Drag-Oriented Interactive Video Manipulation: Drag Anything, Anytime!

本論文は、自己回帰型動画拡散モデルにおいて、生成された動画の任意のフレームを任意の物体に対してインタラクティブにドラッグ操作し、潜空間のドリフトや文脈干渉を抑制するトレーニング不要な手法「DragStream」を提案し、ストリーミング型のドラッグ指向動画操作タスク「REVEL」を実現するものである。

Junbao Zhou, Yuan Zhou, Kesen Zhao, Qingshan Xu, Beier Zhu, Richang Hong, Hanwang Zhang2026-03-10💻 cs

Enhancing Speaker Verification with w2v-BERT 2.0 and Knowledge Distillation guided Structured Pruning

本論文は、大規模自己教師あり学習モデル「w2v-BERT 2.0」を話者検証タスクに応用し、LoRA による効率的な微調整と知識蒸留に基づく構造化プルーニングを組み合わせることで、SOTA 性能を維持しつつモデルサイズを 80% 削減することに成功したことを報告しています。

Ze Li, Ming Cheng, Ming Li2026-03-10💻 cs

PAD-TRO: Projection-Augmented Diffusion for Direct Trajectory Optimization

本論文は、拡散モデルを用いた軌道最適化において、非線形等式制約（動的実現可能性）を明示的に満たすため、状態系列を直接生成し、逆拡散プロセスに勾配なしの射影メカニズムを組み込んだ「PAD-TRO」という新規アプローチを提案し、高密度障害物環境でのクアッドコプタの航法タスクにおいて、既存の最先端手法と比較して動的実現可能性エラーをゼロに抑え、成功率を約 4 倍向上させることを実証しています。

Jushan Chen, Santiago Paternain2026-03-10💻 cs

Membership Inference Attacks on Tokenizers of Large Language Models

本論文は、大規模言語モデルのプライバシーリスク評価における既存の課題を克服し、前処理段階のトークナイザーを新たな攻撃ベクトルとして初めて検討することで、そのメンバーシップ推論攻撃への脆弱性を明らかにし、適応型防御策を提案するものである。

Meng Tong, Yuntao Du, Kejiang Chen, Weiming Zhang, Ninghui Li2026-03-10💻 cs

Vision-Guided Targeted Grasping and Vibration for Robotic Pollination in Controlled Environments

本論文は、制御環境下での精密受粉を実現するため、3D 再構成に基づく視覚誘導把持と物理モデルに基づく振動制御を統合した初のロボットシステムを提案し、高い把持成功率と花への損傷なしの受粉有効性を検証したものである。

Jaehwan Jeong, Tuan-Anh Vu, Radha Lahoti, Jiawen Wang, Vivek Alumootil, Sangpil Kim, M. Khalid Jawed2026-03-10💻 cs

Differentiable Variable Fonts

この論文は、可変フォントのパラメータとベクトルグラフィック間の微分可能な関係を確立する「微分可能可変フォント」を提案し、勾配法による最適化を通じて文字の形状操作、重なり考慮モデリング、物理ベースのアニメーション、および自動フォント設計など、直感的で自動化されたタイポグラフィワークフローを実現するものです。

Kinjal Parikh, Danny M. Kaufman, David I. W. Levin, Alec Jacobson2026-03-10💻 cs

EB-MBD: Emerging-Barrier Model-Based Diffusion for Safe Trajectory Optimization in Highly Constrained Environments

この論文は、制約の厳しい環境におけるモデルベース拡散法のサンプリング非効率性と性能劣化を、内部点法に着想を得た「出現バリア関数」を用いて段階的に制約を導入する手法（EB-MBD）により解決し、投影法に比べて計算コストを大幅に削減しつつ、2 次元および 3 次元の複雑なタスクで高品質な安全軌道最適化を実現することを提案しています。

Raghav Mishra, Ian R. Manchester2026-03-10💻 cs

Real-Time Motion-Controllable Autoregressive Video Diffusion

本論文は、強化学習と自己ロールアウト機構を組み合わせることで、リアルタイムかつ高精度な運動制御を実現し、既存の拡散モデルに比べて大幅な遅延低減と高画質を両立する初の RL 強化型少量ステップ自己回帰動画生成モデル「AR-Drag」を提案するものである。

Kesen Zhao, Jiaxin Shi, Beier Zhu, Junbao Zhou, Xiaolong Shen, Yuan Zhou, Qianru Sun, Hanwang Zhang2026-03-10💻 cs

CDE: Concept-Driven Exploration for Reinforcement Learning

本論文は、事前学習された視覚言語モデルから得られるノイズの多い概念信号を補助的な再構成タスクを通じて活用し、視覚制御タスクにおける効率的な探索を可能にする「概念駆動型探索（CDE）」を提案し、シミュレーションおよび実世界のロボットアーム操作タスクでの有効性を示しています。

Le Mao, Andrew H. Liu, Renos Zabounidis, Yanan Niu, Zachary Kingston, Joseph Campbell2026-03-10💻 cs

Deliberative Dynamics and Value Alignment in LLM Debates

この論文は、Reddit の「Am I the Asshole」コミュニティの事例を用いて大規模言語モデル（LLM）間の議論を分析し、同期・ラウンドロビンといった対話プロトコルやモデルの種類によって、意見の修正率や価値観の優先順位、および順序効果への反応に顕著な差異が生じることを明らかにしています。

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

本論文は、マルチモーダル推論モデルにおける浅い層の知覚バイアスと深い層の推論ドリフトという二つの失敗モードを特定し、学習不要の軽量プラグイン「Functional Head Identification and Class-Conditioned Rescaling」を用いて層間での注意配分を適応的に再調整することで、再学習やアーキテクチャ変更なしに推論の一貫性と視覚的忠実度を向上させる手法を提案しています。

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

Preference-Conditioned Multi-Objective RL for Integrated Command Tracking and Force Compliance in Humanoid Locomotion

この論文は、人間の操作に対する力への追従性と指令追跡性のバランスをユーザーの好みに応じて動的に調整できる、優先度条件付き多目的強化学習フレームワークを提案し、シミュレーションおよび実機実験によりその有効性を検証したものである。

Tingxuan Leng, Yushi Wang, Tinglong Zheng, Changsheng Luo, Mingguo Zhao2026-03-10💻 cs

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

本論文は、視覚言語行動（VLA）モデルに対して、少量のデータ汚染と視覚トリガーを用いて、タスク性能を維持したまま特定の安全上重要な動作を強制的に実行させる「DropVLA」と呼ばれる、動作レベルのバックドア攻撃手法を提案し、その物理世界での有効性を検証したものである。

Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

本論文は、オフラインデータセットで学習された潜在空間の世界モデルとモデル予測制御（MPC）を組み合わせ、人間のデモンストレーションなしで物理的接触を活用したヒューマノイドロボットのリアルタイムかつロバストな動作計画を実現するフレームワークを提案しています。

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

Protege Effect for Behaviour Change: Does Teaching Digital Stress Solutions to Others Reduce One's Own?

デジタルストレスの軽減を目的として他者に教える「プロテジェ効果」を適用した研究では、受動的・能動的な指導グループとも対照群との間に有意な差が見られず、認知的関与が行動変容に直結しない難しさが示されました。

Sameha Alshakhsi, Ala Yankouskaya, Dena Al-Thani, Raian Ali2026-03-10💻 cs

Unsupervised Deep Generative Models for Anomaly Detection in Neuroimaging: A Systematic Scoping Review

本論文は、2018 年から 2025 年にかけて脳 MRI 画像の異常検出に応用された教師なし深生成モデルに関する 33 件の研究を体系的にレビューし、その潜在的可能性と方法論的な課題、そして今後の臨床的有用性を高めるための新たな方向性を明らかにしたものである。

Youwan Mahé, Elise Bannier, Stéphanie Leplaideur, Elisa Fromont, Francesca Galassi2026-03-10💻 cs

A Robust Placeability Metric for Model-Free Unified Pick-and-Place Reasoning

本論文は、不完全な点群データから物体の安定性、把持性、干渉を統合的に評価する確率的な「配置可能性メトリック」を提案し、事前モデルに依存せずに未見の物体に対する堅牢な一貫した把持・配置計画を実現する手法を提示しています。

Benno Wingender, Nils Dengler, Rohit Menon, Sicong Pan, Maren Bennewitz2026-03-10💻 cs

Taming Modality Entanglement in Continual Audio-Visual Segmentation

本論文は、音声と視覚の連続学習におけるモダリティの干渉を解決するため、マルチモーダルなサンプル選択と衝突に基づくリハーサル機構を組み合わせた新しいフレームワークを提案し、音声誘導型の連続オーディオ・ビジュアルセグメンテーションタスクにおける性能向上を実証しています。

Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang2026-03-10💻 cs

PolyJailbreak: Cross-Modal Jailbreaking Attacks on Black-Box Multimodal LLMs

この論文は、マルチモーダル大規模言語モデル（MLLM）における「マルチモーダルな安全性の非対称性」という新たな脆弱性を発見し、これを構造化された原子戦略プリミティブと強化学習に基づく多エージェント最適化を活用して、GPT-4o や Gemini などの商用モデルを含む黒箱モデルに対して既存手法を大幅に上回る攻撃成功率（平均 18.15% 向上、95% 超）を達成する新しいブラックボックス・ジェイルブレイクフレームワーク「PolyJailbreak」を提案するものである。

Xinkai Wang, Beibei Li, Zerui Shao, Ao Liu, Guangquan Xu, Shouling Ji2026-03-10💻 cs

← 前へ次へ →