cs.LG 件の論文 | Gist.Science

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

本論文は、組み合わせ融合分析（CFA）の手法を統合し、PyTorch、TensorFlow、Scikit-learn のワークフローに対応する新しい Python ツール「InFusionLayer」を提案し、コンピュータビジョンデータセットにおけるその有効性を検証したものである。

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

本論文は、暗号化トラフィック分類においてバイト列への平坦化がもたらす意味論的ミスマッチを解決するため、プロトコル定義のフィールド意味をアーキテクチャの事前知識として活用し、予測可能性に基づくフィルタリングや双軸アテンションを備えた表形式のマスクオートエンコーダ「FlowSem-MAE」を提案し、限られたラベル付きデータでも最先端の性能を達成することを示しています。

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

OmniGuide は、3D 空間における微分可能なエネルギー関数として任意のガイダンス源を表現し、VLA モデルの行動サンプリングを誘導することで、複雑なタスクにおける汎用ロボット政策の成功率と安全性を大幅に向上させる柔軟なフレームワークを提案するものです。

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

本論文は、ピックアップ・デリバリー問題のクラスター構造を明示的に活用するクラスター認識型アテンション機構と階層的デコーディングを組み合わせた深層強化学習フレームワーク「CAADRL」を提案し、最先端手法と同等またはそれ以上の性能を、大幅に短い推論時間で達成することを示しています。

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

この論文は、情報幾何学におけるフィッシャー情報計量に基づくリッチスカラーの体積平均が半整数に量子化されるという 20 年前の予想を、木構造や完全グラフでは証明し、一般のループ構造では反証することで解決するとともに、ガウス DAG ネットワークにおける正負の曲率の二項対立を示しています。

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

この論文は、ニューラルセルラオートマトン（NCA）を用いて生成した合成データを事前学習に活用することで、自然言語データのみでの学習よりも効率的に言語モデルの性能を向上させ、推論タスクにおける汎化能力も高めることを示しています。

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

本論文は、Muon 学習アルゴリズムの重みスペクトルが過度に正規化される問題を Heavy-Tailed Self-Regularization 理論に基づいて解決し、LLM の事前学習や画像分類において最先端の性能を達成する「HTMuon」という新しい最適化手法を提案するものである。

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

この論文は、検索エージェントの学習における重要なサンプリング分布のドリフト問題に対処し、既存の GRPO アルゴリズムをわずか 1 行のコード修正で KL 制約を適用する「SAPO」を提案することで、モデルの崩壊を防ぎ、QA ベンチマークで大幅な性能向上を実現したことを報告しています。

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

本論文は、時系列基盤モデル Chronos-T5-Large にスパースオートエンコーダを適用した初の研究であり、中間エンコーダ層に存在する「変化検知」機能が予測精度に最も因果的に重要であることを、392 回にわたる単一特徴量アブレーション実験を通じて実証しています。

Anurag Mishra2026-03-12🤖 cs.LG

Marginals Before Conditionals

この論文は、ニューラルネットワークが条件付き学習を行う際、まず条件付きエントロピーに相当する損失のプラトー（定常状態）を経由し、その後、データセットサイズや学習率などの要因によって制御される急激な転移を経て完全な条件付けを獲得するという、学習ダイナミクスにおける「周辺分布の先行」と「条件付き分布の遅延」という非対称性を明らかにしたものである。

Mihir Sahasrabudhe2026-03-12🤖 cs.LG

Stochastic Port-Hamiltonian Neural Networks: Universal Approximation with Passivity Guarantees

本論文は、ハミルトニアンをニューラルネットワークでパラメータ化し、物理的な構造とパッシビティを保証する「確率的ポートハミルトニアンニューラルネットワーク（SPH-NN）」を提案し、その普遍近似定理の証明と、ノイズを含む振動系における長期的な精度向上を実証的に示しています。

Luca Di Persio, Matthias Ehrhardt, Youness Outaleb2026-03-12🤖 cs.LG

Large Spikes in Stochastic Gradient Descent: A Large-Deviations View

この論文は、NTK スケーリングにおける浅い全結合ネットワークの SGD 学習を大偏差論の観点から解析し、学習率やデータに依存する明示的な関数 $G$ の符号によって、NTK を平坦化する大きなスパイクが発生する確率と振る舞いが決まることを示す定量的理論を提示しています。

Benjamin Gess, Daniel Heydecker2026-03-12🤖 cs.LG

Amnesia: Adversarial Semantic Layer Specific Activation Steering in Large Language Models

この論文は、既存の安全対策をバイパスし、追加の微調整なしで有害なコンテンツを生成させることを可能にする軽量な活性化空間敵対的攻撃手法「Amnesia」を提案し、オープンウェイト大規模言語モデルにおけるセキュリティ対策の強化の緊急性を浮き彫りにしています。

Ali Raza, Gurang Gupta, Nikolay Matyunin, Jibesh Patra2026-03-12🤖 cs.AI

Mitigating Frequency Learning Bias in Quantum Models via Multi-Stage Residual Learning

この論文は、パラメータ化量子回路が持つ周波数学習バイアスを克服するため、古典的なフーリエニューラルオペレータの手法に触発されたマルチステージ残差学習を量子ドメインに適用し、複数の周波数成分を持つ関数の学習精度を大幅に向上させることを示しています。

Ammar Daskin2026-03-12⚛️ quant-ph

Digging Deeper: Learning Multi-Level Concept Hierarchies

この論文は、粗いアノテーションのみから多階層の概念ヒエラルキーを自動発見する「Multi-Level Concept Splitting (MLCS)」と、発見された階層を表現し多段階の介入を可能にする「Deep-HiCEMs」を提案し、解釈性とタスク性能の両立を実現するものです。

Oscar Hill, Mateo Espinosa Zarlenga, Mateja Jamnik2026-03-12🤖 cs.LG

KernelSkill: A Multi-Agent Framework for GPU Kernel Optimization

この論文は、LLM の暗黙的なヒューリスティックに代わって知識駆動型の専門スキルと双層メモリ機構を採用したマルチエージェントフレームワーク「KernelSkill」を提案し、GPU カーネル最適化において既存手法を上回る高い成功率と高速化を実現したことを報告しています。

Qitong Sun, Jun Han, Tianlin Li, Zhe Tang, Sheng Chen, Fei Yang, Aishan Liu, Xianglong Liu, Yang Liu2026-03-12🤖 cs.LG

ES-dLLM: Efficient Inference for Diffusion Large Language Models by Early-Skipping

この論文は、拡散大規模言語モデル（dLLM）の中間表現が反復ごとにわずかにしか変化しないという洞察に基づき、トークンの重要度を推定して早期にスキップするトレーニング不要の高速化フレームワーク「ES-dLLM」を提案し、生成品質を維持しながら最大 16.8 倍の高速化を実現したことを示しています。

Zijian Zhu, Fei Ren, Zhanhong Tan, Kaisheng Ma2026-03-12🤖 cs.LG

A Survey of Weight Space Learning: Understanding, Representation, and Generation

本論文は、ニューラルネットワークの重み空間そのものを分析・モデル化の対象として捉える「重み空間学習（WSL）」という新たな研究分野を初めて体系的に整理し、その理解・表現・生成の 3 つの主要な側面と、モデル検索や継続学習などの実用的応用を包括的に概説する調査論文である。

Xiaolong Han, Zehong Wang, Bo Zhao, Binchi Zhang, Jundong Li, Damian Borth, Rose Yu, Haggai Maron, Yanfang Ye, Lu Yin, Ferrante Neri2026-03-12🤖 cs.LG

Equivariant Asynchronous Diffusion: An Adaptive Denoising Schedule for Accelerated Molecular Conformation Generation

この論文は、分子生成における階層的な因果関係と分子全体の視野を両立させるため、非同期なノイズ除去スケジュールと動的なスケジューリング機構を組み合わせた新しい等変性非同期拡散モデル（EAD）を提案し、3 次元分子生成において最先端の性能を達成したことを示しています。

Junyi An, Chao Qu, Yun-Fei Shi, Zhijian Zhou, Fenglei Cao, Yuan Qi2026-03-12🧬 q-bio

Rethinking Adam for Time Series Forecasting: A Simple Heuristic to Improve Optimization under Distribution Shifts

非定常な時系列データにおける分布のドリフトへの適応性を高めるため、Adam 最適化アルゴリズムの 2 次バイアス補正を除去した軽量な変法 TS_Adam を提案し、実世界の予測タスクにおいて MSE や MAE の大幅な改善を実証した。

Yuze Dong, Jinsong Wu2026-03-12🤖 cs.LG

← 前へ次へ →