TRUST-UP: Trustworthy Reinforcement learning Using Safe Techniques for UAV Pursuit
本論文は、混雑した都市環境において証明可能な安全性と認証可能な自律飛行を保証するために、制御バリア関数に基づくセーフティフィルタと透明性の高い切り替え戦略を組み合わせた、UAVの追跡のための信頼性の高い強化学習フレームワークであるTRUST-UPを導入するものである。
1647 件の論文
CからSまでの分野は、科学の最前線で活躍する研究者たちが日々生み出す多様な発見を網羅しています。Gist.Scienceでは、arXivに登録されたこれらの最新プレプリントをすべて対象に、専門用語に頼らず誰でも理解できる平易な解説と、技術的な詳細を網羅した要約の両方を提供しています。これにより、複雑な研究内容も迅速かつ正確に把握できるようになります。
私たちのチームは、各論文の核心となる発見を丁寧に掘り下げ、専門家だけでなく幅広い読者にも価値ある洞察をお届けすることを目指しています。以下に、この分野から直近で公開された最新の論文リストを掲載します。
本論文は、混雑した都市環境において証明可能な安全性と認証可能な自律飛行を保証するために、制御バリア関数に基づくセーフティフィルタと透明性の高い切り替え戦略を組み合わせた、UAVの追跡のための信頼性の高い強化学習フレームワークであるTRUST-UPを導入するものである。
本論文は、AI駆動型の知覚機能と従来の制御手法を統合し、複雑な建設現場をナビゲートする完全自律型オフロードフォークリフトであるADAPTを提示しており、広範な実世界でのテストを通じて、様々な天候条件下における資材ハンドリングにおいて人間と同等の性能を達成できることを実証している。
本論文は、ノイズが多く非定常なIoT環境において、期待自由エネルギーを最小化することでアイドリング時間とCO2排出量を削減することにより、ルールベースのヒューリスティックおよび深層強化学習の両方を凌駕する、適応的な交通信号管理のための追跡可能な能動的推論コントローラを提案するものである。
本論文は、非線形ダイナミクスのスパース識別(SINDy)と非線形制御配分を組み合わせることで、過剰駆動型航空機のためのコンパクトで解釈可能かつ適応的な制御有効性モデルを構築する新しい手法を提案しており、従来のオンボードモデルと比較して計算コストを大幅に削減しながら、高忠実度の性能とアクチュエータ故障に対するロバスト性を実現している。
本論文では、報酬・ペナルティ最適化に基づく汎用的かつ高速なヒューリスティック・フレームワークであるSearchを紹介するが、これは、最小限の問題固有のチューニングで、多くの場合において最先端の性能に匹敵またはそれを上回りながら、複数のドメインにわたる多様なNP困難な部分グラフ抽出問題を効果的に解決するものである。
本論文は、卸電力市場における系統用蓄電池による一見戦略的な供給抑制行動が、再定式化した線形計画モデルを用いて、充電状態(SoC)レベルとリスク回避性が入札曲線にどのように影響を与えるかを示すことで、価格不確実性下における合理的なリスク管理として説明できることを実証するものである。
本論文は、個々の発電ユニットの系統への重要度を評価およびランク付けするために必要な時間を劇的に短縮する高性能計算フレームワークを紹介するものであり、これにより電力計画担当者が、老朽化する資産や負荷の増大に直面する中で、より広範なリソースの妥当性シナリオを迅速に評価することを可能にする。
本論文は、ファイバー束エンコーダ、入力条件付きニューラル常微分方程式(Neural ODE)、コントラクション合成、およびクープマン・リフティングを統合し、変化する環境制約下で動作する非線形システムに対して厳密な安定性および入力to状態安定性(ISS)の保証を提供する、環境認識型安定ニューラルクープマン力学学習(ESNKD)という統一フレームワークを提案する。
本論文は、不確実性下におけるロープや布のような変形可能な物体の安全かつ高速で保証された操作を実現するために、GPU並列微分可能シミュレータとロバストなモデル予測制御および共形予測を組み合わせたリアルタイム制御フレームワークであるCORD-SLSを提案する。
本論文は、自動運転車両の運動計画におけるモデル選択の判断材料とするため、モデルの複雑さ、パラメータ化の質、および精度の間のトレードオフを解明することを目的として、3種類の単一軌道車両モデルの短期間における位置精度を実測値に対して評価するものである。