Zero-Shot Transferable Solution Method for Parametric Optimal Control Problems
この論文は、関数エンコーダ方策を用いたニューラル基底関数の事前学習とオンラインでの軽量係数推定により、目的関数が変化するパラメータ最適制御問題に対して、従来の最適化手法に比べて計算コストを大幅に削減しつつ、ほぼ最適な性能でゼロショット適応を可能にする転移可能な解法を提案しています。
4177 件の論文
この論文は、関数エンコーダ方策を用いたニューラル基底関数の事前学習とオンラインでの軽量係数推定により、目的関数が変化するパラメータ最適制御問題に対して、従来の最適化手法に比べて計算コストを大幅に削減しつつ、ほぼ最適な性能でゼロショット適応を可能にする転移可能な解法を提案しています。
本論文は、SigLIP モデルで採用されているシグモイド損失関数における可学習な逆温度とバイアスの同期が、-Constellations と呼ばれる新たな組合せ的構造を介して損失をゼロに導くことを理論的に解明し、これにより SigLIP の検索性能の成功や CLIP におけるモダリティギャップの存在、高品質な表現を得るための必要な次元数を説明するとともに、実験的にトレーニングダイナミクスを改善する損失関数の再パラメータ化を提案しています。
2024 年に打ち上げられたメタン観測衛星 MethaneSAT とその航空機搭載センサー MethaneAIR の高空間分解能データを用いて、メタン濃度推定の精度向上に不可欠な雲および雲影の検出課題に対し、U-Net や SCAN などの深層学習モデルが従来の手法を大幅に上回る性能を発揮することを示した。
この論文は、23 の視覚質問応答ベンチマークを対象とした大規模な実証研究を通じて、単一モダリティ依存とモダリティ間依存の複雑な関係を定量的に解明し、多くの既存ベンチマークが意図せず画像依存を強化している実態を明らかにするとともに、より体系的なマルチモーダルベンチマーク設計の指針を提供するものです。
この論文は、レガシーシステムのアップグレードコストや運用停止を回避しつつ、API ベースの軽量な Web インターフェースと人間による介入(ヒューマン・イン・ザ・ループ)の仕組みを通じて、製造業における機械学習の実用化と競争力強化を可能にする実践的なフレームワークを提案しています。
本論文は、タスク固有のプromptと共有プromptの利点を統合し、スパースな混合専門家(MoE)アーキテクチャと動的な専門家選択メカニズムを導入することで、知識干渉を抑制しつつ計算コストとメモリ使用量を大幅に削減した継続学習フレームワーク「SMoPE」を提案し、既存手法を上回る性能を実証したものである。
この論文は、推論言語モデルの性能とコストのトレードオフを解決するため、心理測定学に触発された軽量で解釈可能なルーティングフレームワーク「RADAR」を提案し、質問の難易度とモデルの能力を学習して最適なモデル・予算ペアに動的にルーティングすることで、最先端の手法を上回る性能と汎化能力を実証しています。
本論文では、大規模な設計空間とトレーニングコストの課題を克服するため、小規模なモデル探索とスケーリング戦略を組み合わせたモジュール型ハイブリッドモデルアーキテクチャ検索フレームワーク「Composer」を提案し、Llama 3.2 を凌駕する高性能かつ効率的な新しいハイブリッド LLM アーキテクチャを発見したことを報告しています。
この論文は、変分オートエンコーダと相互情報量に基づく拡散モデルを組み合わせた「MIG-Vis」という手法を提案し、マカク猿の側頭葉下側皮質(IT 野)の神経集団から抽出された潜在変数群が、物体の姿勢やカテゴリ間変換など明確な意味的特徴を選択的に符号化していることを実証したものである。
この論文は、マルチエージェント LLM における協調を促進する手段として、経験に基づくカリキュラム学習が設計次第で逆効果となる可能性があるのに対し、単純なコミュニケーションプロトコルの方がより信頼性の高い調整メカニズムであることを示しています。
この論文は、ウェアラブル EEG による睡眠ステージ分類において、ラベル不足を克服し臨床レベルの精度を達成するために、教師なし学習(SSL)を体系的に評価し、汎用モデルを上回るドメイン特化型パイプラインの有効性を実証したものである。
この論文は、地政学的ショックが直接デフォルトリスクを通じて、地経済的ショックが金融サイクルや政策期待を通じてそれぞれ異なる経路で主権リスクに影響を与える「ハサミ型」のパターンを、2018 年から 2025 年の 42 カ国のデータと機械学習を用いた分析によって実証し、両者のメカニズムの区別が流動性供給の効果範囲を決定づけることを明らかにしている。
この論文は、標準的な音声活動検出(VAD)モデルの特定の層に対してハイパーネットワークを用いてパーソナライズされた重みを生成する「HyWA」という手法を提案し、既存の条件付け手法と比較して精度の向上とアーキテクチャの再利用による展開の容易さを両立させることを示しています。
本論文は、クロスモーダル注意機構、Grad-CAM++ による帰属分析、および「提示 - 修正」フィードバックループを統合した説明可能なバイアス意識生成フレームワークを提案し、マルチモーダル MNIST やファッション MNIST などのベンチマークにおいて、高い精度、ロバスト性、公平性を達成したことを示しています。
この論文は、クラスタリングのコンパクト性と分離性を評価し、真のクラスタ数を決定するための新しい絶対指標を提案し、合成データおよび実データを用いて既存の指標との比較を通じてその有効性を検証したものである。
この論文は、実世界のデータセットにおけるカーネル回帰の学習曲線を、データ共分散行列と目標関数の多項式分解という 2 つの統計量のみから予測する「エルミート固有構造仮説(HEA)」を提案し、その有効性を理論的・実験的に実証するとともに、MLP の学習過程における Hermite 多項式の獲得にも言及しています。
この論文は、幾何学的な解析を用いることで、割引報酬および平均報酬の両方の設定において、ユニークかつユニチェーンな最適政策を仮定すれば、価値反復法が従来の理論よりも高速な幾何学的収束を示すことを示しています。
この論文は、LLM 推論における KV キャッシュの効率的な管理を実現するため、PCA による特徴量非相関化、適応量子化、エントロピー符号化を組み合わせた軽量な変換符号化器「KVTC」を提案し、推論精度を維持しつつ最大 20 倍(特定用途では 40 倍以上)の圧縮率を達成し、既存の手法を上回るメモリ効率化を実現することを示しています。
この論文は、気象や発電構成などの要因と電力価格の複雑な因果関係を捉え、真の因果構造を学習して時系列データに反事実的推論を可能にする「拡張時系列因果モデル(ATSCM)」を提案し、再生可能エネルギーの異なるシナリオ下での価格予測などの新たな分析を可能にすることを示しています。
この論文は、深生成モデルと構造的因果モデルを統合した時系列ニューラル因果モデル VAE(TNCM-VAE)を提案し、金融時系列データにおける因果関係と時間的依存性を維持しつつ、反事実的シナリオ分析やリスク評価を可能にする市場シミュレーターの開発を目指しています。