InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling
本論文は、組み合わせ融合分析(CFA)の手法を統合し、PyTorch、TensorFlow、Scikit-learn のワークフローに対応する新しい Python ツール「InFusionLayer」を提案し、コンピュータビジョンデータセットにおけるその有効性を検証したものである。
4604 件の論文
本論文は、組み合わせ融合分析(CFA)の手法を統合し、PyTorch、TensorFlow、Scikit-learn のワークフローに対応する新しい Python ツール「InFusionLayer」を提案し、コンピュータビジョンデータセットにおけるその有効性を検証したものである。
本論文は、暗号化トラフィック分類においてバイト列への平坦化がもたらす意味論的ミスマッチを解決するため、プロトコル定義のフィールド意味をアーキテクチャの事前知識として活用し、予測可能性に基づくフィルタリングや双軸アテンションを備えた表形式のマスクオートエンコーダ「FlowSem-MAE」を提案し、限られたラベル付きデータでも最先端の性能を達成することを示しています。
OmniGuide は、3D 空間における微分可能なエネルギー関数として任意のガイダンス源を表現し、VLA モデルの行動サンプリングを誘導することで、複雑なタスクにおける汎用ロボット政策の成功率と安全性を大幅に向上させる柔軟なフレームワークを提案するものです。
本論文は、ピックアップ・デリバリー問題のクラスター構造を明示的に活用するクラスター認識型アテンション機構と階層的デコーディングを組み合わせた深層強化学習フレームワーク「CAADRL」を提案し、最先端手法と同等またはそれ以上の性能を、大幅に短い推論時間で達成することを示しています。
この論文は、情報幾何学におけるフィッシャー情報計量に基づくリッチスカラーの体積平均が半整数に量子化されるという 20 年前の予想を、木構造や完全グラフでは証明し、一般のループ構造では反証することで解決するとともに、ガウス DAG ネットワークにおける正負の曲率の二項対立を示しています。
この論文は、ニューラルセルラオートマトン(NCA)を用いて生成した合成データを事前学習に活用することで、自然言語データのみでの学習よりも効率的に言語モデルの性能を向上させ、推論タスクにおける汎化能力も高めることを示しています。
本論文は、Muon 学習アルゴリズムの重みスペクトルが過度に正規化される問題を Heavy-Tailed Self-Regularization 理論に基づいて解決し、LLM の事前学習や画像分類において最先端の性能を達成する「HTMuon」という新しい最適化手法を提案するものである。
この論文は、検索エージェントの学習における重要なサンプリング分布のドリフト問題に対処し、既存の GRPO アルゴリズムをわずか 1 行のコード修正で KL 制約を適用する「SAPO」を提案することで、モデルの崩壊を防ぎ、QA ベンチマークで大幅な性能向上を実現したことを報告しています。
本論文は、時系列基盤モデル Chronos-T5-Large にスパースオートエンコーダを適用した初の研究であり、中間エンコーダ層に存在する「変化検知」機能が予測精度に最も因果的に重要であることを、392 回にわたる単一特徴量アブレーション実験を通じて実証しています。
この論文は、ニューラルネットワークが条件付き学習を行う際、まず条件付きエントロピーに相当する損失のプラトー(定常状態)を経由し、その後、データセットサイズや学習率などの要因によって制御される急激な転移を経て完全な条件付けを獲得するという、学習ダイナミクスにおける「周辺分布の先行」と「条件付き分布の遅延」という非対称性を明らかにしたものである。
本論文は、ハミルトニアンをニューラルネットワークでパラメータ化し、物理的な構造とパッシビティを保証する「確率的ポートハミルトニアンニューラルネットワーク(SPH-NN)」を提案し、その普遍近似定理の証明と、ノイズを含む振動系における長期的な精度向上を実証的に示しています。
この論文は、NTK スケーリングにおける浅い全結合ネットワークの SGD 学習を大偏差論の観点から解析し、学習率やデータに依存する明示的な関数 の符号によって、NTK を平坦化する大きなスパイクが発生する確率と振る舞いが決まることを示す定量的理論を提示しています。
この論文は、既存の安全対策をバイパスし、追加の微調整なしで有害なコンテンツを生成させることを可能にする軽量な活性化空間敵対的攻撃手法「Amnesia」を提案し、オープンウェイト大規模言語モデルにおけるセキュリティ対策の強化の緊急性を浮き彫りにしています。
この論文は、パラメータ化量子回路が持つ周波数学習バイアスを克服するため、古典的なフーリエニューラルオペレータの手法に触発されたマルチステージ残差学習を量子ドメインに適用し、複数の周波数成分を持つ関数の学習精度を大幅に向上させることを示しています。
この論文は、粗いアノテーションのみから多階層の概念ヒエラルキーを自動発見する「Multi-Level Concept Splitting (MLCS)」と、発見された階層を表現し多段階の介入を可能にする「Deep-HiCEMs」を提案し、解釈性とタスク性能の両立を実現するものです。
この論文は、LLM の暗黙的なヒューリスティックに代わって知識駆動型の専門スキルと双層メモリ機構を採用したマルチエージェントフレームワーク「KernelSkill」を提案し、GPU カーネル最適化において既存手法を上回る高い成功率と高速化を実現したことを報告しています。
この論文は、拡散大規模言語モデル(dLLM)の中間表現が反復ごとにわずかにしか変化しないという洞察に基づき、トークンの重要度を推定して早期にスキップするトレーニング不要の高速化フレームワーク「ES-dLLM」を提案し、生成品質を維持しながら最大 16.8 倍の高速化を実現したことを示しています。
本論文は、ニューラルネットワークの重み空間そのものを分析・モデル化の対象として捉える「重み空間学習(WSL)」という新たな研究分野を初めて体系的に整理し、その理解・表現・生成の 3 つの主要な側面と、モデル検索や継続学習などの実用的応用を包括的に概説する調査論文である。
この論文は、分子生成における階層的な因果関係と分子全体の視野を両立させるため、非同期なノイズ除去スケジュールと動的なスケジューリング機構を組み合わせた新しい等変性非同期拡散モデル(EAD)を提案し、3 次元分子生成において最先端の性能を達成したことを示しています。
非定常な時系列データにおける分布のドリフトへの適応性を高めるため、Adam 最適化アルゴリズムの 2 次バイアス補正を除去した軽量な変法 TS_Adam を提案し、実世界の予測タスクにおいて MSE や MAE の大幅な改善を実証した。