Preference-Conditioned Multi-Objective RL for Integrated Command Tracking and Force Compliance in Humanoid Locomotion
この論文は、人間の操作に対する力への追従性と指令追跡性のバランスをユーザーの好みに応じて動的に調整できる、優先度条件付き多目的強化学習フレームワークを提案し、シミュレーションおよび実機実験によりその有効性を検証したものである。
6362 件の論文
この論文は、人間の操作に対する力への追従性と指令追跡性のバランスをユーザーの好みに応じて動的に調整できる、優先度条件付き多目的強化学習フレームワークを提案し、シミュレーションおよび実機実験によりその有効性を検証したものである。
本論文は、視覚言語行動(VLA)モデルに対して、少量のデータ汚染と視覚トリガーを用いて、タスク性能を維持したまま特定の安全上重要な動作を強制的に実行させる「DropVLA」と呼ばれる、動作レベルのバックドア攻撃手法を提案し、その物理世界での有効性を検証したものである。
本論文は、オフラインデータセットで学習された潜在空間の世界モデルとモデル予測制御(MPC)を組み合わせ、人間のデモンストレーションなしで物理的接触を活用したヒューマノイドロボットのリアルタイムかつロバストな動作計画を実現するフレームワークを提案しています。
デジタルストレスの軽減を目的として他者に教える「プロテジェ効果」を適用した研究では、受動的・能動的な指導グループとも対照群との間に有意な差が見られず、認知的関与が行動変容に直結しない難しさが示されました。
本論文は、2018 年から 2025 年にかけて脳 MRI 画像の異常検出に応用された教師なし深生成モデルに関する 33 件の研究を体系的にレビューし、その潜在的可能性と方法論的な課題、そして今後の臨床的有用性を高めるための新たな方向性を明らかにしたものである。
本論文は、不完全な点群データから物体の安定性、把持性、干渉を統合的に評価する確率的な「配置可能性メトリック」を提案し、事前モデルに依存せずに未見の物体に対する堅牢な一貫した把持・配置計画を実現する手法を提示しています。
本論文は、音声と視覚の連続学習におけるモダリティの干渉を解決するため、マルチモーダルなサンプル選択と衝突に基づくリハーサル機構を組み合わせた新しいフレームワークを提案し、音声誘導型の連続オーディオ・ビジュアルセグメンテーションタスクにおける性能向上を実証しています。
この論文は、マルチモーダル大規模言語モデル(MLLM)における「マルチモーダルな安全性の非対称性」という新たな脆弱性を発見し、これを構造化された原子戦略プリミティブと強化学習に基づく多エージェント最適化を活用して、GPT-4o や Gemini などの商用モデルを含む黒箱モデルに対して既存手法を大幅に上回る攻撃成功率(平均 18.15% 向上、95% 超)を達成する新しいブラックボックス・ジェイルブレイクフレームワーク「PolyJailbreak」を提案するものである。
この論文は、人間の動的挙動をデータ駆動モデルで予測し、到達可能性に基づく安全性の保証を初期制御入力に限定することで、人間との 3 次元空間における安全かつ効率的なマイクロ航空機(MAV)のナビゲーションを実現するモデル予測制御(MPC)フレームワーク「HumanMPC」を提案し、シミュレーションおよび実世界実験でその有効性を検証したものである。
本論文は、インターネットや電力、ハードウェアが不足するバングラデシュの教育環境の制約を克服し、Minecraft を活用したゲーミフィケーション学習を可能にするための、3 つの展開階層とローカライズされたカリキュラムを提案する HCI 枠組みを提示しています。
本論文は、自律走行の知覚タスクにおける合成データの有用性を検証し、3D 資産を駆使して多視点のコーナーケースを大規模に生成する新たなフレームワーク「Dream4Drive」と大規模 3D アセットデータセット「DriveObj3D」を提案し、下流の知覚モデルの性能向上を実証しています。
本論文は、動的な Gaussian Splatting における多様な課題を解決するため、複数の専門家の出力を画素レベルで適応的に統合する「Volume-aware Pixel Router」を備えた Mixture of Experts 手法「MoE-GS」を提案し、最先端の描画品質と効率性を両立させることを示しています。
本論文は、Kubernetes 環境における Valkey、KeyDB、Garnet の Redis 代替候補をベンチマークし、スループットやレイテンシ、リソース効率、移行の複雑さ、そしてコミュニティの持続性などの観点から、それらのパフォーマンスと将来性を包括的に評価したものである。
本論文は、非専門家でも自然言語で分析意図を伝え、構造化されたリスク証拠を検証し、追跡可能な専門家スタイルの推論を得られるよう、ルール抽象化・証拠スコアリング・専門家風正当化の 3 つの役割を統合した人間中心のマルチエージェントシステム「HCLA」を提案し、暗号資産取引の異常検知において、ブラックボックスモデルの解釈ではなく、規制や調査判断に整合する追跡可能な推論プロセスの再構築を通じて、説明可能性を超えた説明責任と透明性の実現を目指すものである。
この論文は、多様なデータ密度に対する堅牢なコンテキストモデルと、分布外データへの効率的な適応を可能にするインスタンス適応型微調整戦略を導入した汎用点雲圧縮フレームワーク「AnyPcc」を提案し、15 の多様なデータセットにおいて新たな最先端性能を達成したことを示しています。
この論文は、ロボットアームによる能動的な撹拌と適応制御システムを導入することで、水トラップ内の害虫の重なりを解消し、高密度環境下でも従来の静止画像法よりも高い精度で害虫を自動計数する手法を提案しています。
本論文は、自己教師あり学習に基づくビジョン基盤モデル DINOv2 を用いたトランスフォーマーフレームワーク「CountFormer」を提案し、例示なしの物体数え上げにおいて視覚的反復や構造の学習がどのように改善されるかを検証し、FSC-147 ベンチマークで競争力のある性能を示すとともに、表現の質が数え上げ精度に重要であることを明らかにしています。
この論文は、言語 3D ガウススプラッティングメモリを活用して、多モーダルなオープンボキャブラリー目標クエリと複数目標の視覚ナビゲーションを効率的に実現する「LagMemo」を提案し、新規に作成した GOAT-Core データセットを用いた実験で最先端の手法を大幅に上回る性能を示したことを報告しています。
本論文は、線形ブレンドや既存の生成手法では困難であった多様なクリップ間の滑らかな遷移を実現するため、アートのワークフローから着想を得て構造情報と生成合成を組み合わせ、微調整なしに高品質な中間フレームを生成するゼロショット手法「SAGE」を提案し、定量的・定性的な評価で既存手法を上回る性能を示したものです。
本論文は、コンピュータビジョンとねじロック機構を用いた自律ドッキングにより、2 台の独立した移動マニピュレータを物理的に結合して単一の二腕移動マニピュレータ「MobiDock」を構成し、複雑な協調制御を単純化するとともに、動的安定性と作業効率を大幅に向上させることを提案・実証したものである。