From Thinker to Society: Security in Hierarchical Autonomy Evolution of AI Agents
この論文は、LLM 駆動の AI エージェントの自律性進化に伴う新たなセキュリティ課題に対し、認知・実行・集合的自律の 3 段階で脅威を分類し、多層防御アーキテクチャの構築を提唱する階層的自律進化(HAE)フレームワークを提示しています。
8799 件の論文
この論文は、LLM 駆動の AI エージェントの自律性進化に伴う新たなセキュリティ課題に対し、認知・実行・集合的自律の 3 段階で脅威を分類し、多層防御アーキテクチャの構築を提唱する階層的自律進化(HAE)フレームワークを提示しています。
本論文は、200 以上のプラットフォームから 760 万以上のデータセットを統合し、意味的注釈とマルチエンティティ拡張ナビゲーションを通じて、分散したデータエコシステムにおける信頼性の高いデータ発見と探索を実現する統一フレームワーク「SeDa」を提案するものである。
本論文は、Tweedie の公式を用いて「Drifting モデル」がガウス平滑化分布におけるスコアマッチングの原理と厳密に等価であることを示し、拡散モデルや DMD との理論的関係を明らかにするとともに、ラプラス核に対する誤差評価も提供しています。
本論文は、実世界の人間 - 物体相互作用(HOI)制御を可能にする統合された物理ベースの模倣学習フレームワーク「InterReal」を提案し、接触制約を考慮したデータ拡張とメタポリシーに基づく自動報酬学習により、Unitree G1 などの実機において高い追従精度とタスク成功率を実現したことを示しています。
本論文は、フリーハンドスケッチをラスター画像やストローク系列ではなく構造化グラフとして直接モデル化する「SketchGraphNet」を提案し、344 万点のスケッチを含む大規模ベンチマーク「SketchGraph」上で、補助的な位置・構造エンコーディングを不要としながら、メモリ効率と精度を両立した認識を実現したことを報告しています。
この論文は、事前定義された脳アトラスや線形仮定に依存する既存手法の限界を克服し、神経動態を考慮した事前学習フレームワークを導入することで、多様なシナリオにおける個人固有の脳機能ネットワーク構築を実現し、その汎用性と精度を大幅に向上させることを提案しています。
この論文は、長編のテキストと画像を交互に生成する際に視覚履歴の蓄積が品質劣化を招くという課題を特定し、モデル内部の関連性に基づいて不要な視覚情報を動的に排除する「UniLongGen」という推論戦略を提案することで、長期生成の安定性と忠実度を大幅に向上させることを示しています。
DreamSAC は、ハミルトニアンに基づく好奇心ボーナスを用いた対称性探索戦略と、生データから物理的保存則を学習する自己教師ありコントラスト学習を組み合わせた世界モデルを導入することで、統計的相関ではなく物理法則を習得し、未知の物理特性への外挿一般化を飛躍的に向上させる手法を提案しています。
この論文は、単一橋梁のモデルを拡張した複合橋梁ネットワークのメンテナンスにおいて、強化学習で得られた方策をPRISM言語で記述し、確率的モデル検査と説明可能性手法を用いて安全性保証と解釈性を検証する「COOL-MC」というツールの有効性を示しています。
この論文は、大規模なアクセント付きデータや学習を必要とせず、音韻規則と多言語 TTS モデルを組み合わせることで、音声の明瞭さを保ちながらスペイン語やインド英語などのアクセントを音素レベルで制御可能な新しい音声合成フレームワークを提案するものである。
この論文は、ゼロショット音声合成モデルから特定の話者アイデンティティを除去する「音声生成話者ポイズニング(SGSP)」という新たな課題を定義し、15 名までの話者に対してプライバシー保護とモデル有用性の両立を達成するフレームワークを提案しています。
ネパール語(ネワール語)の音声認識におけるリソース不足を解消するため、5.39 時間の手書き転写コーパス「Nwāchā Munā」を公開し、大規模多言語モデルに匹敵する性能を、近隣言語であるネパール語からの転移学習によって達成したことを報告する論文です。
この論文は、生成・再構成・識別の 3 要素と関心領域(ROI)アテンション機構を組み合わせた GRD-Net を提案し、不良検出における従来のポストプロセッシング依存を排除し、MVTec データセットや製薬業界の実際のデータを用いた実用的な異常検出と欠陥局所化を実現する手法を述べています。
本論文は、画像分類における分布外(OOD)検出の性能を評価するため、クロスエントロピー損失、プロトタイプ損失、トリプレット損失、平均精度損失の 4 つの代表的な学習目的関数を OpenOOD 基準で体系的に比較し、クロスエントロピー損失が全体的に最も一貫した OOD 検出性能を示すことを明らかにしています。
本論文は、医薬品製造のブロー・フィル・シーリング(BFS)ラインにおける高速なオンライン異常検出を実現するため、正常サンプルのみで学習する生成敵対的アーキテクチャに基づく半教師ありフレームワークを提案し、500ms の時間制約内で高精度な検出と局所化を達成したことを報告しています。
この論文は、推論コストを削減しつつ回答の品質を維持するため、問題の難易度に応じて推論部分と回答部分を分離し、それぞれに適切な強化学習信号を適用する「Difficulty-Scaled Segment-Wise GRPO(DSS-GRPO)」を提案しています。
本論文は、人間の運動適応の段階的な性質を反映した「段階的マルチエージェント訓練(SMAT)」を提案し、シミュレーションおよび実機実験を通じて、ユーザーごとの再訓練なしに一貫した支援と正味の機械的パワーを実現するコ適応型外骨格制御の成功を示しています。
この論文は、NVIDIA Omniverse を活用したアルジェ国際空港のデジタルツインに基づく合成データ生成パイプラインを提案し、限られた実データのアノテーションを合成データと組み合わせることで、手作業を 25〜35% 削減しつつも、高密度で重なり合う手荷物カートの検出において実データのみを使用する場合と同等以上の精度を達成できることを実証しています。
本論文は、長期のタスクや継続的な学習を可能にするため、タスク計画、原子スキルの抽象化、微細な動作を統合的に生成し、エキスパートの動的な組み合わせによって拡張性と汎用性を高める「AtomicVLA」という新しいロボティクスフレームワークを提案しています。
本論文は、近距離の鏡面反射を明示的なレイトレーシングなしに効率的にモデル化し、高速な学習と最先端の性能を両立させる「反射双対ガウススプラッティング(Ref-DGS)」という新しいフレームワークを提案するものです。