Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation
この論文は、瞬間速度制約を付与することで表現力と計算効率を両立し、ロボット操作タスクにおいて最先端の成功率と高速な推論を実現する、一歩でアクションを生成する新しい生成方策「平均速度方策(MVP)」を提案するものです。
8451 件の論文
この論文は、瞬間速度制約を付与することで表現力と計算効率を両立し、ロボット操作タスクにおいて最先端の成功率と高速な推論を実現する、一歩でアクションを生成する新しい生成方策「平均速度方策(MVP)」を提案するものです。
本論文は、構造化された領域(有界な物理パラメータや離散 - 連続ハイブリッド変数など)に制約されるシミュレーションに基づく推論(SBI)の問題に対し、幾何学的制約と離散潜在構造の両方を統合的に扱える新しい変分フローマッチングフレームワーク「Pawsterior」を提案し、従来の手法では困難だったより広範な SBI 課題への適用を可能にするものです。
この論文は、コード生成が強化学習よりも信頼性高く進展した理由を、コードが持つ密で局所的かつ検証可能なフィードバックという情報構造に求め、計算問題の「表現可能性」「計算可能性」「学習可能性」の 3 特性を階層的に整理し、機械学習の進展の上限が単なるモデルの規模ではなく、タスク自体の学習可能性に依存することを示唆しています。
本論文は、数時間にわたる音声データを構造化されたイベント記録に変換し、SQL データベースから関連するイベントを検索して大規模言語モデルの回答を支援するハイブリッド型フレームワーク「LongAudio-RAG」を提案し、その精度向上とエッジ - クラウド環境での実用性を示したものである。
この論文は、誤差信号の伝播遅延と指数関数的減衰という予測符号化の課題を、出力層から全隠れ層への直接フィードバック接続を導入することで解決し、理論的な誤差伝播の時間計算量を O(L) から O(1) に削減するとともに、標準的な手法と同等以上の性能を実現する「直接コレン・ポラック予測符号化(DKP-PC)」を提案しています。
本論文は、異質なデータソースから共有特徴抽出器を学習する際、すべてのソースを併用するのではなく、統計的に最適な部分集合(情報豊富サブ集団)をスクリーニングして選択的に学習することで、大量のデータを破棄しても最小最大最適性を達成できることを理論的・実験的に示しています。
本論文は、ポアンカレ球埋め込みを用いたモダリティ階層の表現と双方向メッセージ伝達によるハイパーグラフ融合、および双曲空間における対照学習を組み合わせた「Emotion Collider(EC-Net)」を提案し、ノイズやモダリティ欠損に対して頑健で高精度な多モーダル感情認識を実現することを示しています。
本論文は、トレーニング中に意図的に特定のモダリティ情報を破壊的に縮小させることで、入力チャネルの欠損や破損に対して頑健なマルチモーダル表現を学習する「ModalImmune」というフレームワークを提案し、その有効性を示しています。
本論文は、成虫のハエの完全な脳結合体(コネクトーム)の構造をそのまま活用した「FlyGM」と呼ばれるグラフモデルを開発し、これを生体力学モデルと統合することで、特定のタスクごとの設計変更なしに果実ハエの全身運動を効率的かつ安定的に制御できることを実証したものである。
この論文は、従来のカバレッジ保証を超えて、コンフォーマル予測の運用上の指標(コミット頻度や誤り曝露など)に対する有限サンプル保証を提供し、それらのトレードオフを可視化・最適化するための新しい手法と理論的枠組みを提案しています。
この論文は、回転や並進などの対称変換に対する頑健な物体認識を実現するために、事前知識を必要とせず対称変換の例から潜在空間で等変な演算子を学習するアーキテクチャの有効性を MNIST データセットで実証しつつ、複雑なデータセットへの拡張における課題を論じています。
この論文は、CityLearn 環境を用いて都市エネルギー制御におけるマルチエージェント強化学習(MARL)を多角的な KPI で評価し、分散学習分散実行(DTDE)が集中学習分散実行(CTDE)よりも優れており、時間依存性の学習がバッテリー寿命などの持続可能性指標の改善に寄与することを示しています。
本論文は、分散型取引所の流動性プロバイダーが手数料収益とリバランスコストのトレードオフを最適化するため、平均回帰市場における最適インパルス制御問題を定式化し、深層強化学習を用いた「RAmmStein」手法を提案することで、過剰なリバランスを抑制しつつ資本効率を大幅に向上させることを示しています。
本論文は、分子グラフニューラルネットワーク(GNN)と分子フィンガープリントを融合したフレームワークが単独モデルよりも優れた性能を示すことを実証し、CKA 解析を通じて GNN とフィンガープリントが独立した潜在空間を形成し、異なる GNN アーキテクチャ間には高い表現の類似性があることを明らかにした。
ModernBERT 基盤の多言語エンコーダ「MrBERT」は、35 言語とコードの事前学習、Matryoshka 表現学習による柔軟な次元適応、および特定ドメインへの最適化を通じて、地域言語の卓越性と専門分野での高性能、そして推論・保存コストの削減を同時に実現するモデルファミリーを提案し、Hugging Face でオープンソース化されています。
本論文は、EEG 信号と画像表現の整合を学習し、VQ-VAE とトランスフォーマーを用いた「次スケール予測」に基づく自己回帰的生成フレームワーク「AVDE」を提案し、既存の拡散モデルよりもはるかに軽量でありながら、画像復元や検索タスクにおいて最先端の性能を達成し、人間の視覚知覚の階層性を反映する解釈可能な脳コンピュータインターフェースを実現したことを示しています。
CeRA は、SiLU ゲーティングと構造的ドロップアウトを併用して多様体を拡張し、低ランク適応(LoRA)が抱える線形性の限界を打破し、複雑な推論タスクにおいて極めて高いスペクトル効率を実現するパラメータ効率型ファインチューニング手法です。
App Store の検索ランキングにおいて、LLM を活用して生成したテキスト関連性ラベルを行動データと組み合わせることで、オフライン評価指標の改善と、特にロングテールクエリにおけるコンバージョン率の統計的有意な向上(+0.24%)を実現した。
この論文は、光粒子検出器のシミュレーション、較正、再構成を単一の微分可能フレームワークで統合し、勾配ベースの最適化を通じて従来の手法を凌駕する精度と効率で粒子特性を推定する初のエンドツーエンド微分可能シミュレーターを提案しています。
本論文は、FP4 精度の注意機構における訓練の不安定さを解消し、アウトライヤー対策なしに品質を回復しながら RTX 5090 で最大 1.5 倍の高速化を実現する、初の体系的な量子化感知学習(QAT)手法「Attn-QAT」を提案するものです。