Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance
本論文は、スライスト・ワルシュタイン距離の計算における積分問題に対し、決定性点過程や反発点過程に基づく quadrature 法を調査・ベンチマークし、低次元では乱択準モンテカルロ法、高次元では UnifOrtho 推定量の使用を推奨する研究結果を提示しています。
5159 件の論文
本論文は、スライスト・ワルシュタイン距離の計算における積分問題に対し、決定性点過程や反発点過程に基づく quadrature 法を調査・ベンチマークし、低次元では乱択準モンテカルロ法、高次元では UnifOrtho 推定量の使用を推奨する研究結果を提示しています。
本論文は、大規模な汎用ロボットポリシーの研究を支援するために、シミュレーションと実世界のロボットを統一的に扱うモジュラーかつ軽量なエコシステム「Robot Control Stack (RCS)」を提案し、その設計原則と VLA や RL ポリシー開発における有用性を評価したものである。
生物学的な同期現象に着想を得たクルモントモデルを拡散過程に応用し、指紋やテクスチャなどの方向性豊かな画像生成において、位相の同期と非同期を制御することで従来の等方性拡散モデルを超える性能を実現する新しい生成モデルを提案する。
この論文は、大規模言語モデルによるコード変異エージェント「AlphaEvolve」を活用して、MAX-CUT やメトリック TSP などの組合せ最適化問題における近似不可能性の新たな下限を導出するガジェット構成を発見し、検証プロセス自体も AI によって高速化することで、複雑性理論の進展に AI が貢献できることを示した研究です。
本論文は、ConceptNet や WordNet などの外部知識グラフを統合し、災害後の衛星および UAV 画像の記述において、既存の汎用視覚言語モデルが抱える専門用語の欠如や事実誤認を解消し、より具体的かつ正確なキャプション生成を実現する「VLCE」というフレームワークを提案し、xBD や RescueNet などのベンチマークで高い性能を示したことを報告するものである。
本論文は、テスト時エントロピー最小化におけるモデルの崩壊を防ぎ、バイアスのある学習信号を正則化して性能を向上させるための、効率的な非対称シエスミアンアーキテクチャ「ZeroSiam」を提案し、視覚適応から大規模言語モデルの推論まで多様なタスクでその有効性を示しています。
この論文は、追加の学習なしに複数の事前学習済みロボット方策の分布スコアを凸結合してテスト時に合成する「General Policy Composition (GPC)」を提案し、理論的根拠と実証実験を通じて、個々の方策単体よりも優れた制御性能と適応性の向上を実現することを示しています。
この論文は、時間変動する非線形システムの制御において、大量のデータから迅速な制御を学習する深層強化学習(DRL)と、モデル非依存かつロバストな有界極値探索(ES)を組み合わせることで、両者の長所を統合し、時間変動に対する耐性を大幅に向上させたハイブリッド制御手法を提案し、ロスアラモス国立研究所の線形加速器における低エネルギービーム輸送セクションの自動調整への適用事例を通じてその有効性を検証したものである。
音声トークンの長さがテキストに比べて著しく長いことによる計算効率の低さを解決するため、音声トークンを高レベルの潜在パッチに集約して両モダリティの粒度を揃え、計算効率と性能を同時に向上させる「Latent Speech-Text Transformer (LST)」を提案する論文です。
本論文は、複雑な問題解決における推論能力の限界と検証の信頼性という 2 つのボトルネックを解決するため、構造化されたツール呼び出し、ターンレベルの強化学習、そして検証と長期記憶を組み合わせた進化ループを統合した「AlphaApollo」という自律的推論システムを提案し、複数の数学推論ベンチマークで顕著な性能向上を実証しています。
本論文は、LiDAR 3D セマンティックセグメンテーションにおけるドメイン一般化と不完全ラベルという未解決課題に焦点を当て、既存手法の限界を克服し、信頼性に基づく双視点フレームワーク「DuNe」を提案することで、複数のデータセットにおいて最先端の性能を達成したことを報告しています。
本論文は、視覚的推論を検証可能な記号問題へと変換し、チャートや図表などの構造化された視覚データに対する推論精度を飛躍的に向上させるために、視覚を可実行コードへ逆変換する「デレンダリング」を活用した新しいエージェントフレームワーク「RECODE」を提案するものです。
本論文は、生成タスクにおいて従来のエキスパートマージ手法よりも優位性を示し、ルーターゲート値とエキスパート活性化ノルムを考慮した新たな剪定基準「REAP」を提案することで、大規模なSMoEモデルの50% 剪定においてもコード生成などのタスクでほぼ損失のない圧縮を実現することを明らかにしています。
本論文は、拡散ビジョモーターポリシーを基盤とした実世界強化学習フレームワーク「RL-100」を提案し、模倣学習と強化学習を統合して 1000 回の試行で 100% の成功率を達成し、人間を超える性能と高い汎用性・頑健性を示したことを報告しています。
この論文は、検証可能な答えを持たないタスクにおける推論過程を潜在変数として扱うことで Bradley-Terry 尤度の構造が変化するという課題を解決し、一貫性のあるモンテカルロ推定量を用いた Bradley-Terry 方策最適化(BTPO)を提案することで、連鎖思考(CoT)を含む生成型選好モデルの安定した学習を実現したことを示しています。
この論文は、エージェント間の異質性レベルを事前に知らずに、環境や目的関数の多様性に応じて協調学習の利点を自動的に調整し、独立学習に対して最大で線形加速を実現する新しいパーソナライズド協調学習フレームワーク「AffPCL」を提案し、その理論的保証を示すものである。
本論文は、2D エンコーダの限界を克服し、RGB 画像から強力な 3D 幾何学的事前知識を抽出してアクションヘッドに注入する新たなパラダイム「FALCON」を提案し、シミュレーションおよび実世界タスクにおいて最先端の性能と高い汎用性を達成したことを報告しています。
この論文は、グラフ基礎モデルの発展に伴い未探索であったグラフドメイン逐次学習(Domain-IL)における catastrophic forgetting を、埋め込みのシフトと決定境界の逸脱を防ぐための知識の解離と保存を可能にする「GraphKeeper」を提案し、既存手法を大幅に上回る性能で達成したことを示しています。
この論文は、構造化正則化、ロバストな前処理、効率的な最適化を通じて過学習を抑制し、多クラス分類におけるロジスティック回帰に基づく再較正手法のバイアス・バリアンスのトレードオフを効果的に管理することで、既存の手法よりも大幅な精度向上を実現する手法を提案し、オープンソース実装を提供しています。
本論文は、時間系列基盤モデルのデータ価値評価において、従来の手法が抱える計算コストと時系列依存性の課題を解決するため、コンテキスト微調整と時間ブロック集約を活用した軽量かつ高精度な評価手法「LTSV」を提案し、その有効性を検証したものである。