Step-Size Decay and Structural Stagnation in Greedy Sparse Learning
本論文は、スパース学習における過剰なステップサイズ減衰が特徴の相干性により低次元の現実問題であっても構造的な停滞を引き起こすことを理論的に示し、数値実験でこれを裏付けています。
8686 件の論文
本論文は、スパース学習における過剰なステップサイズ減衰が特徴の相干性により低次元の現実問題であっても構造的な停滞を引き起こすことを理論的に示し、数値実験でこれを裏付けています。
本論文は、ゲームに依存しない微分可能な均衡ブロック(DEB)をモジュールとして用いる「深層インセンティブ設計(DID)」フレームワークを提案し、契約設計や機械スケジューリングなど多様なインセンティブ設計課題に対して、単一のニューラルネットワークで広範なゲーム規模にわたる均衡を効率的に学習・解決できることを示しています。
この論文は、自然言語処理やコンピュータビジョンとは異なりスケーリングが不安定なタンパク質言語モデル(PLM)に対し、小規模モデルの表現を大規模モデルの埋め込みの最初の次元に一致させる「Reverse Distillation」というフレームワークを提案し、これにより埋め込み次元を固定したままモデルサイズが大きくなるほど性能が向上し、ProteinGym ベンチマークで SOTA 性能を達成することを示しています。
本論文は、ブランド広告の安定したユーザー行動と迅速なフィードバックという特性を活用し、複雑な機械学習モデルに依存せずオンライン等方回帰を用いて入札から支出・成約までの単調な関係を構築する軽量なモデル予測制御(MPC)フレームワークを提案し、実装の容易さとコスト効率の向上を実現するものである。
この論文は、連合グラフ学習の脆弱性を突くため、学習時にデータを隠蔽的に変位させ、学習後にその情報を基に効率的に敵対的摂動を生成する「Hide and Find」方式の分散型敵対的攻撃手法「FedShift」を提案し、既存手法を上回る攻撃成功率と防御回避能力、および 90% 以上の時間削減を実現したことを示しています。
この論文は、金融時系列予測における過信を抑制し、レジームシフトやショックに対するロバスト性を向上させるため、不確実性を内部制御信号として表現・伝播・生成の各段階でゲート制御する「不確実性ゲート型生成モデル(UGGM)」を提案し、NYISO における MSE 63.5% の削減などの顕著な成果を示したものです。
GPU 加速と大規模言語モデル(LLM)を組み合わせた新しい SMT ソルバー「GANRA」を開発し、非線形実数算術問題の求解において、既存の最先端手法を大幅に凌駕する性能向上を実現しました。
本論文は、現代のコード生成モデルが抱えるトレーニングのボトルネックを解決するため、条件付き切り捨てマスクや多様性に基づく温度選択などの3つの革新を導入した「MicroCoder-GRPO」手法と、より高品質なデータセットおよび評価フレームワークを提案し、LiveCodeBench v6 において基線モデルを大幅に上回る性能向上とトレーニングに関する34の洞察を明らかにしたものである。
この論文は、複数の過渡的な時間におけるパウリ測定データを最大尤度法で解析し、ニューラル微分方程式を補助的に用いて非凸な損失関数の最適化を可能にすることで、ノイズに対して頑健かつ効率的に量子オープンシステムのリンブリアン(散逸を含むダイナミクス生成子)を学習する手法を提案しています。
本論文は、LLM ベースの予測・較正・選択フレームワークを用いた自動難易度フィルタリングを含む 4 段階のデータ処理パイプラインを提案し、これにより構築された高品質な競合プログラミングデータセット「MicroCoder」が、既存のデータセットと比較してコード生成モデルの学習効率と難問に対する性能を大幅に向上させることを実証しています。
本論文は、ラベル付けされていない専門家動画からタスクの進捗を推定して報酬を学習し、敵対的更新と高速な JAX 基盤を統合することで、連続学習における忘却を抑制し、複雑な操作タスクの習得を可能にする「ProgAgent」という強化学習エージェントを提案しています。
この論文は、Vision Transformer における学習能力の低下(可塑性の喪失)のメカニズムを解明し、従来のパラメータ再初期化では効果がなく、勾配方向を適応的に再構成する幾何学的な最適化手法「ARROW」が可塑性の維持と新タスクへの適応性能向上に有効であることを示しています。
本論文は、逆強化学習を用いて単一の時間変化するコスト関数が、被験者や姿勢に依存せず人間の到達運動を高精度に予測・説明できることを実証し、この種の運動を支配する統一的な最適性原理の存在を支持しています。
この論文は、グローバル位相の冗長性を排除して幾何学的整合性を高める複素射影空間(CPS)に基づく深層学習フレームワークを提案し、MU-MISO システムの precoding 性能と汎化能力を大幅に向上させることを示しています。
本論文は、物理情報ニューラルネットワーク(PINN)に多ヘッド構造と主成分分析を組み合わせることで、粘性バース方程式の解空間を低次元の埋め込み空間として効率的に表現し、その物理的解釈性を保ちながら主要なダイナミクスを捉える手法を提案するものである。
この論文は、限られた農業データにおいて、複雑なクロスビューアテンションや SSM よりも単純な畳み込みモジュールの方が優れており、バックボーンモデルの質こそが予測精度を決定する主要因であることを示しています。
本論文は、大規模かつ多様なデータから学習した汎用的な特徴抽出器と、限られたデータで訓練するタスク固有のドメインアダプターを二段階のバイレベル最適化で組み合わせる転移学習フレームワークを提案し、これにより限られたデータでも高品質な MR 画像再構成を実現することを示しています。
本論文は、移動目標の勾配を計算することで半勾配法と競合する学習速度を実現し、Atari ゲームなど多様なベンチマークで勾配 TD 法の学習速度と安定性を両立させた「Gradient Iterated Temporal-Difference learning」を提案し、その有効性を示したものである。
この論文は、拡散モデルを用いたベイズ逆問題において、勾配計算を不要とする軽量な尤度代理モデルを提案することで、推論コストを大幅に削減しつつ最高レベルの性能を実現する「Guess & Guide」と呼ばれるゼロショット手法を提示するものである。
この論文は、複雑な時系列依存性と進化する横断面構造を有する高次元金融時系列における構造的な不安定性を検出するために、予測不一致、再構成の劣化、潜在歪み、ボラティリティのシフトなどの信号を統合し、経済的に整合的な要因レベルの帰属を可能にする解釈可能な生成フレームワーク「ReGEN-TAD」を提案するものである。