ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning
本論文は、非滑らかなハイブリッド力学や極端な報酬の希薄さという課題を克服し、ハイブリッド力学に基づく状態初期化戦略(HDSS)を導入することで、ケーブル吊り下げ型クアッドコプターによる自律的な逆転飛行を世界で初めて実現した強化学習フレームワーク「ASTER」を提案しています。
8117 件の論文
本論文は、非滑らかなハイブリッド力学や極端な報酬の希薄さという課題を克服し、ハイブリッド力学に基づく状態初期化戦略(HDSS)を導入することで、ケーブル吊り下げ型クアッドコプターによる自律的な逆転飛行を世界で初めて実現した強化学習フレームワーク「ASTER」を提案しています。
本論文は、アモエボット構造の並列移動(ジョイントムーブメント)モデルにおいて、補助的な仮定なしに任意の構造をラウンドで線形構造へ再構成するサブリニア時間普遍再構成アルゴリズムを初めて提案し、このモデルが補助仮定なしに効率的な再構成を可能にすることを示した。
この論文は、絶滅危惧種である板鰓類(エラスモブランチ)の保全と生物多様性モニタリングを支援するため、地中海東部沿岸の 7 種を対象に、陸上環境で収集された高品質な画像と専門家による注釈を備えた「eLasmobranc Dataset」を公開し、微細な形態分類を可能にする新たなリソースを提供したことを報告しています。
この論文は、拡散トランスフォーマーの推論コストを削減するため、時間的領域ではなく空間的冗長性に着目し、学習不要で最大 7 倍の高速化を実現する新たなフレームワーク「Just-in-Time (JiT)」を提案しています。
本論文は、LLM の曖昧な指示による誤答を解消し、信頼性と検査可能性を高めるため、ユーザーの情報ニーズを関係スキーマとして再具体化(リリアイフィケーション)し、それを基に実行可能なプログラムを生成する AI エージェント「Pneuma-Seeker」を提案し、その有効性を示したものである。
本論文は、回転する単一光源とイベントカメラ、およびキャリブレーション不要の軽量ピクセルごとのニューラルネットワークを組み合わせることで、環境光や高光沢の影響を受けにくい高精度なイベントベースのフォトメトリックステレオ手法を提案し、既存手法より平均角度誤差を 7.12% 削減する成果を示しています。
本論文は、LLM エージェントの間接プロンプトインジェクション攻撃を、外部観測を制御してツール呼び出しの因果的必要性を検証する「アトリガード」というランタイム防御手法により、高い検出精度と適応攻撃への耐性をもって防ぐことを提案しています。
この論文は、STEM 分野の視覚推論における MLLM の限界が推論能力ではなく知覚能力にあることを発見し、実行可能なコードを知覚の媒体として活用する「CodePercept」を提案し、100 万組の画像・説明文・コードのデータセットと、画像復元コード生成による厳密な評価ベンチマークを導入することでこの課題を解決しようとするものです。
本論文では、RAG パイプラインの各コンポーネントをモジュール化し、実世界のワークロードをシミュレートしながら、パフォーマンスと精度を包括的に評価できるエンドツーエンドのベンチマークフレームワーク「RAGPerf」の設計と実装を提案しています。
本論文は、中小企業が直面する地域限定インフラ環境において、炭素排出量、コスト、遅延制約を同時に考慮し、洞察に基づく探索空間剪定技術を用いてマイクロサービスを動的に配置する「Aceso」を提案し、実環境での評価により既存の静的配置と比較して炭素排出量を37.4%、運用コストを3.6%削減しながらサービスレベル目標を維持できることを示しています。
この研究は、K-12 教師が MagicSchool.ai を活用した AI 生成評価基準の導入に関するワークショップに参加した結果、AI が下書き作成や基準の明確化に有用である一方、文脈への適合性や編集のしやすさ、教師の管理権の維持が課題として認識され、条件付きの導入意向を示したことを明らかにしています。
本論文は、IoT ネットワークにおける変化する脅威環境下で、カテゴリー忘却を抑制しつつリソース制約を満たすために、CICIoMT2024 データセットを用いて LSTM ベースの逐次フェデレーティング学習アプローチを評価し、累積的学習や代表性学習が最も安定した性能を示すことを明らかにしたものである。
この論文は、拡散モデルの条件付きガイダンスにおいて、従来の意味的に空虚なヌルプロンプトの代わりに、トランスフォーマーのコンテンツトークンを戦略的に劣化させた条件を用いる「条件劣化ガイダンス(CDG)」を提案し、追加の学習や外部モデルなしに複雑な構成的タスクの精度を大幅に向上させることを示しています。
透明ガラス器具内の弱い境界や光学アーティファクトに起因する化学実験の監視課題に対し、新規データセット「CTG 2.0」と LGA-RCM-YOLO モデルを提案し、高精度かつリアルタイムな液相・気相界面のインスタンスセグメンテーションを実現することで、実験自動化のための実用的な視覚センサーとして機能することを示した。
本論文は、フローマッチングにおける最適化ダイナミクスを二次形式として分析し、勾配競合を緩和する「セマンティック・グラニュラリティ・アライメント(SGA)」を提案することで、テキストから画像への生成タスクにおける収束速度と構造的完全性の向上を実現することを示しています。
この論文は、EVMbench の評価手法に存在するデータ汚染やスコープの狭さなどの限界を指摘し、拡張された評価により AI エージェントが単独でスマートコントラクトの完全自動化監査を実現するには至っていないことを示し、人間の判断と組み合わせた人間中心のワークフローの重要性を強調しています。
本論文は、偏光 BRDF モデルと深度ガイド可視性マスクを導入して拡散成分と鏡面反射成分を物理的に分離し、高速かつ高精度な反射表面の再構築を実現する「PolGS++」を提案するものである。
この論文は、ビジョン・トランスフォーマーにおけるバックドア攻撃の内部表現として「トリガ方向」を特定し、その因果的役割を実証するとともに、層ごとの処理メカニズムの差異や敵対的攻撃との関連性を分析し、重みベースの検出手法を提案することで、機械的解釈性を用いたセキュリティ脆弱性の診断と対策の枠組みを示しています。
この論文は、地球科学の複雑なデータ構造を効率的に表現・処理するために、圧縮木構造に基づく一般化されたデータハイパーキューと、それを活用した特徴抽出システムを提案し、大規模な異種データセットへのスケーラブルかつユーザー中心のアクセスを実現する統合フレームワークを構築するものである。
この論文は、中国絵画の専門的評価を可能にする大規模視覚言語モデル「HanMoVLM」を提案し、専門家による検証付きの思考連鎖と報酬関数を用いて評価精度を向上させ、画像生成におけるテスト時スケーリングの検証器として機能させることを実証しています。