Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds
本論文は、目的関数によって誘起される多様体の幾何構造を n 次元球で局所的に近似し、学習率を不要とする測地線勾配降下法(GGD)を提案し、全結合ネットワークおよび畳み込みニューラルネットワークにおいて Adam などの既存手法を上回る性能向上を実証しています。
10038 件の論文
本論文は、目的関数によって誘起される多様体の幾何構造を n 次元球で局所的に近似し、学習率を不要とする測地線勾配降下法(GGD)を提案し、全結合ネットワークおよび畳み込みニューラルネットワークにおいて Adam などの既存手法を上回る性能向上を実証しています。
この論文は、VAE による次元削減と GAT を用いた IoT ボットネット検出において、グラフ構築手法(kNN、MNN、SNN、ガブリエルグラフ、ε-半径グラフ)の選択が分類性能に大きな影響を与えることを示し、ガブリエルグラフを用いた場合に 97.56% の最高精度を達成したことを報告しています。
本論文は、現代の AI アプリケーションが求める高効率な検索、高速インデックス作成、低メモリ使用量などの 6 つの要件をすべて満たすため、投影技術とグラフインデックスを統合した新しい近似最近傍検索フレームワーク「PAG」を提案し、HNSW より最大 5 倍高速な検索性能を実現することを示しています。
この論文は、人間の骨格運動の幾何学的・運動学的制約を無視した従来のデータ拡張手法の限界を克服し、それぞれ異なる単一の幾何学的変換で拡張されたデータを用いて専門家のモデルを個別に学習させる「EnsAug」というアノテーション駆動のアンサンブル手法を提案し、手話認識や人間活動認識のタスクにおいて最先端の精度を達成したことを示しています。
本論文は、マルチモーダル LLM による継続的ビデオ QA におけるタスク間干渉と記憶コストの課題を解決するため、メタ学習に基づく正則化や因果的視点からの補助的マルチモーダル監督を活用し、メモリ固定条件下でトークンを動的に生成・制御する「HyperTokens」を提案し、高い精度と低い忘却を実現する手法を報告しています。
本論文は、ERP 財務リスク検出におけるデータリーク問題を解消し、再構築された実験フレームワーク「ERP-RiskBench」とスタッキングアンサンブル学習を用いて、より信頼性の高い検出精度と解釈可能性を実現する手法を提案しています。
この論文は、歴史的な油彩画の断面を分析する際、大気や取得アーティファクトの影響を軽減し、解釈性を向上させるために、重み付きスペクトル角度距離(WSAD)損失関数とパッチベースのモデル化を組み合わせた教師なし CNN オートエンコーダーを提案し、ヴァン・エイク兄弟に帰属する「ゲントの祭壇画」の断面データでその有効性を実証したものである。
この論文は、CMS 実験のトリガー効率向上に向けた粒子運動量推定タスクにおいて、グラフニューラルネットワーク(GNN)が TabNet などの従来モデルより Mean Absolute Error において優れており、ノード特徴量の次元が効率に重要であることを示しています。
この論文は、限られたアノテーションデータ条件下でトウモロコシ、イネ、小麦の葉病を高精度に分類し、Grad-CAM による可視化で意思決定の透明性を確保する、XAI と少数ショット学習を統合したハイブリッド分類モデルを提案するものである。
本論文は、チャートの深層分析能力の向上に向けた課題として、多様な報酬信号やデータ間の競合を解消する並列相対方策最適化(PRPO)と、エラー注入に基づく客観的評価ベンチマーク(MCDR-Bench)を提案し、これらを通じてチャート深層分析のトレーニングと評価を体系的に改善する統合フレームワークを構築したことを示しています。
この論文は、事後サンプリングにおける推定誤差を軽減し、より高品質な生成を実現するために、追加の逆方向ノイズ除去ステップとモンテカルロサンプリングを組み合わせたプラグアンドプレイ手法「ABMS」を提案し、理論的解析と多様なタスクにおける実験を通じてその有効性を証明したものである。
この論文は、訓練データが存在しない条件下でも、畳み込みフィルタリングと最適化された早期停止戦略を用いた教師なし学習フレームワークにより、高エネルギー加速器のビーム診断において低信号対雑音比環境でのビームエミッタンス画像の高精度な復元とビームハローの解像度向上を実現する手法を提案しています。
この論文は、不変性と等変性のトレードオフを解決するため、最終埋め込みには不変性を維持しつつ中間空間トークンマップに等変性を「ソフト」に付与する新しい正則化手法「Soft Equivariance Regularization (SER)」を提案し、画像認識や物体検出などのタスクで既存の自己教師あり学習手法を大幅に改善することを示しています。
本論文は、RGB 入力のみを用いたマルチモーダル大規模言語モデル(MLLM)がカメラ固有のパラメータに過剰適合し汎化能力に欠けることを指摘し、カメラ内部パラメータの注入、カメラパラメータの多様化によるデータ拡張、および 3D 視覚基盤モデルからの幾何学的知識の蒸留を行う「カメラ認識型 MLLM」を提案することで、空間推論タスクにおけるカメラ間での汎化性能を大幅に向上させることを示しています。
本論文は、太陽フレア予測の信頼性向上を目的として、分布仮定を必要としないコンフォーマル予測の枠組みを適用し、特にコンフォーマライズド・_quantile_回帰が他の手法よりも高いカバレッジ率と適切な区間長を実現することを示しています。
本論文は、大規模なツール環境において小規模言語モデル(SLM)がコンテキストの制御と実行構造を学習し、ルブリックに基づく強化学微細調整を通じて、パラメータやコンテキスト制約が厳しい条件下でも最先端のエージェントに匹敵する性能を発揮できるようにする「ATLAS」というフレームワークを提案するものである。
プライバシー規制により制限される電子カルテの共有を可能にするため、MIMIC-IV データベースを用いて高忠実度の生成モデルと大規模言語モデルによる自動監査を組み合わせたパイプラインを開発し、統計的忠実度だけでなく臨床的一貫性も保証された合成患者トラジェクトリを生成し、その結果、下流タスクでの性能向上とプライバシーリスクの不在を実証しました。
本論文は、タンパク質の配列と構造の情報を対照学習を用いて統合し、両者の埋め込み空間を一致させることで、クロスモーダル検索や機能予測などの下流タスクの性能向上とタンパク質の理解・設計への新たな洞察を提供する「ProtAlign」というフレームワークを提案しています。
この論文は、人間の行動と環境要因の双方向フィードバック融合を活用して、室内の二酸化炭素と PM2.5 濃度を高精度かつ解釈可能に予測する新しいフレームワークを提案し、既存の手法を上回る性能を実証したものである。
本論文は、時系列基盤モデルが捉えた過去のパターンを予測特徴量として回帰モデルに注入する「FutureBoosting」という新しいハイブリッド AI 手法を提案し、電力価格予測の精度を大幅に向上させることを実証しています。