cs.LG 件の論文 | Gist.Science

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

本論文は、生成ドリフトがガウスカーネル下で滑らかな分布のスコア差と等価であることを示し、 McKean-Vlasov 動力学の線形化や Wasserstein 勾配流の観点から理論的基盤を確立するとともに、収束速度の向上や安定な訓練のための停止勾配の必要性を明らかにしたものである。

Erkan Turan, Maks Ovsjanikov2026-03-11🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

ECG と PPG の同期データから構成される新しいベンチマーク「SignalMC-MED」を提案し、バイオシグナル基盤モデルの評価においてドメイン特化モデルの有効性、マルチモーダル融合の優位性、および手動特徴量と学習表現の相補性を明らかにした。

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton2026-03-11🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

本論文は、PPO における学習率の不適切な設定が隠れ層ニューロンの活性化パターンに与える影響を「過学習・未学習指標（OUI）」で定量化し、トレーニング初期段階で学習率の良否を高精度に判定し不要な学習を早期に剪定できる手法を提案しています。

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

この論文は、LLM をファインチューニングまたはゼロから学習させることで、ブレークポイント設定やステップ実行などの対話的制御を可能にする「ニューラルデバッガー」を提案し、CruxEval における高い性能と、将来的な自律型コーディングシステムにおける世界モデルとしての基盤性を示しています。

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

この論文は、行列演算子ノルムの幾何学的解釈に基づき、層ごとの合成性と幅に依存しない滑らかさの保証を実現する新しい平均正規化ノルムを導入し、これによりモデル幅を超えた学習率の安定した転送を可能にする新しい最適化手法「MOGA」を提案し、大規模な事前学習実験で Muon と同等以上の性能と高速性を示したことを報告しています。

Ruihan Xu, Jiajin Li, Yiping Lu2026-03-11🤖 cs.LG

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Contrastive 学習とマスク画像モデルの課題を解決するため、セマンティック・インスタンス・ピクセルの 3 段階の粒度で階層的視覚表現を学習し、大規模なマルチ粒度データセットを用いた C2FMAE が、画像分類・物体検出・セマンティックセグメンテーションにおいて顕著な性能向上を実現したことを提案する論文です。

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

Think Before You Lie: How Reasoning Improves Honesty

この論文は、人間とは異なり大規模言語モデルにおいて推論プロセスが誠実さを高める効果をもたらすことを示し、その理由として欺瞞的な領域が不安定であり、推論による表現空間の探索がより安定した誠実なデフォルト状態へとモデルを導くことを発見したことを報告しています。

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

この論文は、従来の超位置（superposition）の理解が不十分な現実的なデータにおいて、特徴間の相関を考慮した「Bag-of-Words 超位置（BOWS）」モデルを提案し、相関する特徴が干渉を構築的に利用して意味的なクラスタや循環構造を自然に形成することを示しています。

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

この論文は、物理的な制約と適応的な表現学習を統合した「タスク認識型変調（TAM-RL）」フレームワークを提案し、地上観測データの希薄さや地域偏りによる課題を克服することで、既存の手法よりも大幅に精度を向上させた陸域炭素フラックスの全球スケールへのアップスケーリングを実現したことを示しています。

Aleksei Rozanov, Arvind Renganathan, Vipin Kumar2026-03-11🤖 cs.LG

Online Neural Networks for Change-Point Detection

この論文では、大規模な時系列データに対して線形計算量で実行可能かつ最適解への収束が証明された、ニューラルネットワークとオンライン学習に基づく 2 つの新しい変化点検出手法を提案し、既存の手法を上回る性能を実証するとともに、オフライン手法よりも優れる条件を明らかにしています。

Mikhail Hushchyn, Kenenbek Arzymatov, Denis Derkach2026-03-10🤖 cs.LG

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

この論文は、線形予測子と BART 成分の共分散を共有する際に生じる識別不能性やバイアスを、木生成の移動を改良することで解決し、主要な共変量間の複雑な相互作用をモデル化可能にする半パラメトリック・ベイズ加性回帰木（BART）の拡張手法を提案し、教育評価データやベンチマークデータを用いた検証でその有効性を示したものである。

Estevão B. Prado, Andrew C. Parnell, Keefe Murphy + 3 more2026-03-10🤖 cs.LG

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

本論文では、切削工具の摩耗や破損に伴う主軸振動の時間領域応答と統計的特徴を分析し、特徴選択と群知能アルゴリズムによる最適化を組み合わせたホワイトボックス型サポートベクターマシン（SVM）フレームワークを提案し、工具状態のリアルタイム監視におけるその有効性と解釈可能性を実証しています。

Tejas Y. Deo, B. B. Deshmukh, Keshav H. Jatakar, Kamlesh M. Chhajed, S. S. Pardeshi, R. Jegadeeshwaran, Apoorva N. Khairnar, Hrushikesh S. Khade, A. D. Patange2026-03-10🤖 cs.LG

← 前へ次へ →

cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Towards a Neural Debugger for Python

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

Think Before You Lie: How Reasoning Improves Honesty

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Task Aware Modulation Using Representation Learning for Upsaling of Terrestrial Carbon Fluxes

Online Neural Networks for Change-Point Detection

Accounting for shared covariates in semi-parametric Bayesian additive regression trees

A White-Box SVM Framework and its Swarm-Based Optimization for Supervision of Toothed Milling Cutter through Characterization of Spindle Vibrations

Automated Reinforcement Learning: An Overview

Explainable classification of astronomical uncertain time series

Empirical Asset Pricing via Ensemble Gaussian Process Regression

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part I

On the Impact of Sampling on Deep Sequential State Estimation

Remaining-data-free Machine Unlearning by Suppressing Sample Contribution

Survey of Computerized Adaptive Testing: A Machine Learning Perspective

Simulating Non-Markovian Open Quantum Dynamics with Neural Quantum States