HTMuon: Improving Muon via Heavy-Tailed Spectral Correction
本論文は、Muon 学習アルゴリズムの重みスペクトルが過度に正規化される問題を Heavy-Tailed Self-Regularization 理論に基づいて解決し、LLM の事前学習や画像分類において最先端の性能を達成する「HTMuon」という新しい最適化手法を提案するものである。
2384 件の論文
本論文は、Muon 学習アルゴリズムの重みスペクトルが過度に正規化される問題を Heavy-Tailed Self-Regularization 理論に基づいて解決し、LLM の事前学習や画像分類において最先端の性能を達成する「HTMuon」という新しい最適化手法を提案するものである。
この論文は、単一のプロンプト評価ではなく持続的な対話におけるガードレールの劣化を連続的に測定し、攻撃モデルの安全性拒否を排除した自動レッドチームングフレームワーク「ADVERSA」を提案し、最先端の LLM における安全性の崩壊ダイナミクスと判定者の信頼性を包括的に評価したものです。
本論文は、時系列基盤モデル Chronos-T5-Large にスパースオートエンコーダを適用した初の研究であり、中間エンコーダ層に存在する「変化検知」機能が予測精度に最も因果的に重要であることを、392 回にわたる単一特徴量アブレーション実験を通じて実証しています。
この論文は、Vul4J ベンチマークを用いた大規模言語モデル(LLM)によるセキュリティパッチ生成の分析を通じて、構文は正しいがセキュリティ修復の意図を誤解するケースが多く、機能維持とセキュリティ修復の間に大きな乖離があることを明らかにし、厳格な検証の必要性を説いています。
この論文は、ニューラルネットワークが条件付き学習を行う際、まず条件付きエントロピーに相当する損失のプラトー(定常状態)を経由し、その後、データセットサイズや学習率などの要因によって制御される急激な転移を経て完全な条件付けを獲得するという、学習ダイナミクスにおける「周辺分布の先行」と「条件付き分布の遅延」という非対称性を明らかにしたものである。
本論文は、UAV スワームの分散フェデレーティング学習において、従来の異常検出に依存せず勾配の周波数特性を利用した「TASER」という新しい防御フレームワークを提案し、巧妙なバックドア攻撃を効果的に抑制しながら主タスクの精度を維持することを示しています。
この論文は、既存の安全対策をバイパスし、追加の微調整なしで有害なコンテンツを生成させることを可能にする軽量な活性化空間敵対的攻撃手法「Amnesia」を提案し、オープンウェイト大規模言語モデルにおけるセキュリティ対策の強化の緊急性を浮き彫りにしています。
この論文は、粗いアノテーションのみから多階層の概念ヒエラルキーを自動発見する「Multi-Level Concept Splitting (MLCS)」と、発見された階層を表現し多段階の介入を可能にする「Deep-HiCEMs」を提案し、解釈性とタスク性能の両立を実現するものです。
この論文は、LLM の暗黙的なヒューリスティックに代わって知識駆動型の専門スキルと双層メモリ機構を採用したマルチエージェントフレームワーク「KernelSkill」を提案し、GPU カーネル最適化において既存手法を上回る高い成功率と高速化を実現したことを報告しています。
この論文は、拡散大規模言語モデル(dLLM)の中間表現が反復ごとにわずかにしか変化しないという洞察に基づき、トークンの重要度を推定して早期にスキップするトレーニング不要の高速化フレームワーク「ES-dLLM」を提案し、生成品質を維持しながら最大 16.8 倍の高速化を実現したことを示しています。
この論文は、思考モードを持つ大規模言語モデルが複数のタスクを同時に処理する際の脆弱性を利用し、複数のタストリームを絡ませる「マルチストリーム摂動攻撃」を提案することで、既存の安全対策を回避し、思考プロセスの崩壊や出力の反復を引き起こすことを示しています。
OpenClaw やスキルマーケットの普及に伴い、LLM アジェントの取引における実行リスクが新たな攻撃面となる中、本論文は「Survivability-Aware Execution (SAE)」と呼ばれる実行層の生存性基準を提案し、意図されたポリシーと実際の実行の乖離(Delegation Gap)を可視化・制御することで、取引損失や攻撃成功を劇的に抑制する手法を提示している。
この論文は、分子生成における階層的な因果関係と分子全体の視野を両立させるため、非同期なノイズ除去スケジュールと動的なスケジューリング機構を組み合わせた新しい等変性非同期拡散モデル(EAD)を提案し、3 次元分子生成において最先端の性能を達成したことを示しています。
この論文は、解釈性の低い深層強化学習に代わり大規模言語モデルを用いて可読なコードとして方策を生成する「コード空間反応オラクル(CSRO)」という新たなマルチエージェント学習フレームワークを提案し、競合する性能を維持しつつ説明可能な多様な戦略の発見を実現することを示しています。
この論文は、従来のハードスパースティの限界を克服し、最上位ビット(MSB)を代理として利用する「ソフトスパースティ」パラダイムを提案することで、ReLU および Tanh 活性化関数を用いた CNN の推論において、精度を損なわずに乗算演算を大幅に削減し、エッジデバイス向けに電力効率を向上させる手法を提示しています。
この論文は、最終的な正解だけでなく中間推論ステップの正しさも考慮する対照学習を組み込んだ CLIPO を提案し、LLM の推論におけるハルシネーションや一般化性の欠如といった RLVR の課題を解決し、頑健な政策最適化を実現する手法を提示しています。
この論文は、LLM の「真ん中の情報を見失う(Lost in the Middle)」現象が学習や位置符号化に起因するのではなく、残差接続を持つ因果的デコーダの幾何学的性質に由来し、初期化段階(トレーニング前)ですでに存在する構造的な偏りであることを、厳密な理論と実験的検証によって明らかにしたものである。
本論文は、従来の反応的な VLA モデルが抱える時制の不一致や文脈の欠如を解決するため、独自の長期記憶を維持して連続的な動作を生成する「AR-VLA」と呼ばれる新しい自己回帰型アクション専門モジュールを提案し、より滑らかで文脈に敏感なロボット制御を実現する手法を提示しています。
この論文は、ドメイン専門家の手作業に依存していたデータ製品の改善を、質問の提示や多面的な品質指標の監視、そして人間の介入を可能にする制御機能を備えた専門 AI エージェントによる継続的最適化ループを通じて自動化するシステムを提案しています。
この論文は、形式言語理論における生成と認識の間の本質的な非対称性を、計算複雑性や曖昧さなど新たに特定された 6 つの次元から包括的に分析し、両者が拡張的には等価であるにもかかわらず操作的にどのように異なるかを明らかにしています。