Integrating Lagrangian Neural Networks into the Dyna Framework for Reinforcement Learning
この論文は、物理法則を遵守するラグランジュ神経回路網(LNN)をモデルベース強化学習の Dyna フレームワークに統合し、状態推定に基づく最適化手法を用いることで、従来のブラックボックス手法よりも高速かつ正確な動的モデル学習を実現することを提案しています。
322 件の論文
この論文は、物理法則を遵守するラグランジュ神経回路網(LNN)をモデルベース強化学習の Dyna フレームワークに統合し、状態推定に基づく最適化手法を用いることで、従来のブラックボックス手法よりも高速かつ正確な動的モデル学習を実現することを提案しています。
この論文は、大規模言語モデルを駆使した生成エージェントが、電力のdispatch やオークションにおける人間の意思決定の柔軟性を従来の数学モデルから解放し、文脈学習を通じて合理的な戦略の再現や行動の偏りを示すことを実証したものである。
この論文は、非線形システムのフィードバック線形化枠組みにおいて、タスクの要件に応じてアクチュエータ入力を「必須」「冗長」「器用(dexterity)」に分類し、器用な入力を動的に無効化しても共通の延長系上で線形化を維持できることを示すことで、完全なタスクから縮小されたタスクへの円滑な移行を可能にする統一的な制御手法を提案しています。
経済的モデル予測制御の漸近安定性を保証するために、最適制御問題の値関数と直接関連付けられ、厳密な受動性よりも検証が容易な新たな「2 つの貯蔵関数を必要とする厳密な受動性」という概念を提案し、その十分必要条件としての性質や終端コスト設計との関係を論じています。
この論文は、定常周期的レートモノトニックリアルタイムシステムにおいて、応答時間の分布を逆ガウス分布の混合モデルで近似し、期待値最大化アルゴリズムを用いて故障率を推定する手法を提案し、その有効性をシミュレーションで検証したものである。
この論文は、複数のドローンが剛体で荷物を運ぶシステムにおいて、H2 制御に着想を得た新たなロバスト性指標を用いて、ドローンの配置と制御器を同時に最適化し、外乱に対する耐性を最大化する手法を提案し、実験でその有効性を検証したものである。
本論文は、パケット損失が発生する不安定な通信リンクを持つ有向ネットワークにおいて、狭帯域の誤りなしフィードバックチャネルを活用し、任意のパケット損失パターン下でも全ノードが正確な最大値を有限時間で計算し、自律的に収束判定を行う新しい分散アルゴリズム「DMaC」を提案するものです。
この論文は、大規模言語モデル(LLM)を活用して探索を行い、標準的なプログラミング言語で記述された解釈可能な制御方策を自動生成する手法を提案し、振り子の振り上げやボールとカップなどのタスクにおける複雑な振る舞いの制御を実現することを示しています。
本論文は、擾乱の分布に関する仮定を置かないエネルギー有界な擾乱を持つ不確かな線形時不変システム向けに、パラメータ推定の精度を保証する新たな標的探索戦略を提案し、半正定値計画問題を用いた設計手法と数値例による有効性を示しています。
この論文は、離散イベントシステムのモジュラ制御手法を用いて電力系統の連鎖故障の予測と抑制を効率的に行い、MATLAB によるシミュレーションで IEEE 標準システムにおいてその有効性を実証するものである。
本論文は、非線形制御アフィン系(特にドリフトフリーおよび線形時不変システム)の確率密度を制御するために、白色ノイズによる前向き拡散過程と、これを目標分布へ誘導する決定論的逆拡散過程に基づく新しいフィードバック制御・計画フレームワークを提案し、その理論的保証と数値的有効性を示しています。
この論文は、埋め込みリアルタイム最適化(特に誘導・制御分野)向けに、問題の再定式化を不要とし、スパース性を維持しながら非現実性を検出できるカスタマイズ型第二次円錐計画法ソルバーと、そのコード生成ツールを開発し、組込みプラットフォーム上でのベンチマークにより既存ソルバーを上回る性能を実証したものである。
この論文は、大域的制御場のみを用いたアナログ量子シミュレータが普遍性を持つための必要十分条件を理論的に確立し、直接量子最適制御法を用いて実機(リチウム原子アレイ)で多体相互作用やトポロジカルダイナミクスを実証することで、ハードウェア固有のハミルトニアンを超えた汎用的な量子シミュレーションの実現可能性を示した。
本論文は、制御性能と作動頻度のバランスを最適化するため、スパース性促進正則化を用いたイベントベース制御枠組みを提案し、組み合わせ最適化問題に対して rollout アルゴリズムを適用することで計算可能な近似解を得るとともに、周期制御に対する性能保証と閉ループ系の安定性を理論的に証明している。
この論文は、最小接続性( 個のエッジ)のみで多エージェントシステムを所望の平面対称配置へ誘導し、さらに仮想軌道に沿った並進・回転・拡大縮小を可能にする、回転対称制約に基づく分散型形成制御戦略を提案しています。
この論文は、低圧配電系統のリアルタイム制御とプライバシー保護を両立させるため、家庭単位での多項式最適化と中央集権的計画を組み合わせ、予測に基づく柔軟性アグリゲーション手法を提案し、43 バス系統での検証によりその有効性を示したものである。
この論文は、通信ネットワークにおける時間遅延やパケット損失などの不安定な動的変化に対して、Zames-Falb フィルタ係数と線形行列不等式を用いて指数収束率が保証された離散時間最適化アルゴリズムの解析と設計手法を提案し、その有効性を示すものである。
この論文は、厳密な受動性(strict dissipativity)とターンパイク現象の双方向の関係を確立し、動的な一般化ナッシュ均衡のシステム理論的性質を明らかにするとともに、ゲーム理論的モデル予測制御の安定性と再帰的実現可能性の基礎を築くための条件と設計手法を提示しています。
この論文は、分散型エネルギーリソースの普及に伴う複雑な選好を扱うため、機械学習を活用した反復的な組み合わせクロック交換メカニズムを導入し、プロシューマーが直感的な形式で入札できるローカルエネルギー市場を提案し、約 15 回のクロック反復で収束することを実証しています。
この論文は、安全性が保証された自律システムの実現に向けて、人間の選好やデモンストレーションから重み付き信号時相論理(WSTL)を用いて学習する手法を提案し、構造的な剪定と対数変換によって混合整数線形計画問題として効率的に解くことで、ロボティクスやF1レーシングなどの複雑なタスクにおいて安全かつ最適な行動を導出することを示しています。