cs.LG 件の論文 | Gist.Science

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

本論文は、LSTM と量子回路ボーンマシン（QCBM）を統合したハイブリッド量子古典フレームワークを提案し、上海証券取引所などの実データを用いた実験で、従来の古典モデルを上回る金融市場ボラティリティ予測精度を達成したことを示しています。

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

この論文は、スプリット学習における通信オーバーヘッドを削減するため、ラベル情報を活用してチャネルの重要度を評価し、重要度の低いチャネルを適動的に剪定して中間特徴データを圧縮する「ACP-SL」という新しい手法を提案し、その有効性を示したものです。

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

Information Theoretic Bayesian Optimization over the Probability Simplex

この論文は、情報幾何学に基づいて確率単体上の幾何学的な構造を反映したカーネルと最適化手法を提案し、制約付きユークリッド空間のアプローチよりも優れた性能を示す新しいベイズ最適化アルゴリズム「 $\alpha$ -GaBO」を導入するものである。

Federico Pavesi, Antonio Candelieri, Noémie Jaquier2026-03-11🤖 cs.LG

Good Reasoning Makes Good Demonstrations: Implicit Reasoning Quality Supervision via In-Context Reinforcement Learning

この論文は、正解に至る過程の質を文脈内学習による「証拠獲得（Evidence Gain）」で評価し、それを報酬の重み付けに活用する「文脈内 RLVR」を提案することで、従来の強化学習では見逃されがちな推論の質を向上させ、数学的ベンチマークにおいて精度と推論能力の両方を改善することを示しています。

Tiehua Mei, Minxuan Lv, Leiyu Pan, Zhenpeng Su, Hongru Hou, Hengrui Chen, Ao Xu, Deqing Yang2026-03-11🤖 cs.LG

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

本論文は、偏微分方程式の数値解法におけるマルチグリッド法に着想を得た軽量な修正モジュール「疑似射影体」を提案し、トランスフォーマーベースのモデルに組み込むことでノイズへの感度を低減し、学習の安定性とロバスト性を向上させることを実証しています。

Vitaly Bulgakov2026-03-11🤖 cs.AI

A Unified Hierarchical Multi-Task Multi-Fidelity Framework for Data-Efficient Surrogate Modeling in Manufacturing

本論文は、製造システムにおける異質な多忠実度データを活用し、タスク間の類似性と忠実度依存の不確実性を統合的に学習することで予測精度を大幅に向上させる、階層的なマルチタスク・マルチ忠実度ガウス過程代理モデル枠組みを提案しています。

Manan Mehta, Zhiqiao Dong, Yuhang Yang, Chenhui Shao2026-03-11🤖 cs.LG

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

この論文は、地理空間データを用いてスペクトル需要を予測し、空間的自己相関の問題を解決することで既存モデルより 21% 高い精度を達成する階層型アテンションネットワーク「HR-GAT」を提案し、5 つの主要カナダ都市でその有効性を実証したものである。

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

GAST: Gradient-aligned Sparse Tuning of Large Language Models with Data-layer Selection

この論文は、データとレイヤーの両次元で選択的微調整を行う統合最適化戦略「GAST」を提案し、既存の手法が見過ごしていたデータとレイヤーの非対称な寄与を考慮することで、大規模言語モデルのパラメータ効率型微調整の性能を向上させることを示しています。

Kai Yao, Zhenghan Song, Kaixin Wu, Mingjie Zhong, Danzhao Cheng, Zhaorui Tan, Yixin Ji, Penglei Gao2026-03-11🤖 cs.LG

CarbonBench: A Global Benchmark for Upscaling of Carbon Fluxes Using Zero-Shot Learning

本論文は、希少なエディ相関観測データに依存しない炭素フラックスのアップスケーリングを評価するための初のゼロショット空間転移学習ベンチマーク「CarbonBench」を提案し、567 の観測地点から得られた 130 万超のデータを用いて、異なる植生や気候帯へのモデルの一般化性能を厳密に検証する枠組みを提供しています。

Aleksei Rozanov, Arvind Renganathan, Yimeng Zhang, Vipin Kumar2026-03-11🤖 cs.LG

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

この論文は、逐次学習における大規模言語モデルの忘却を抑制しつつ適応性を維持するため、サンプルごとの記憶強度を推定し適応的にリハーサルをスケジュールする新しい経験再生フレームワーク「MSSR」を提案し、広範な実験で最先端の手法を上回る性能を実証したものである。

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

この論文は、既存の Adam 型最適化手法の理論的限界を克服し、リプシッツ定数や事前知識を必要とせず、特にノイズがゼロの状況でほぼ最適な収束速度を達成する新しい適応的指数移動平均法「OptEMA」を提案し、その厳密な収束保証を示すものです。

Ganzhao Yuan2026-03-11🤖 cs.LG

Generative Drifting is Secretly Score Matching: a Spectral and Variational Perspective

本論文は、生成ドリフトがガウスカーネル下で滑らかな分布のスコア差と等価であることを示し、 McKean-Vlasov 動力学の線形化や Wasserstein 勾配流の観点から理論的基盤を確立するとともに、収束速度の向上や安定な訓練のための停止勾配の必要性を明らかにしたものである。

Erkan Turan, Maks Ovsjanikov2026-03-11🤖 cs.LG

SignalMC-MED: A Multimodal Benchmark for Evaluating Biosignal Foundation Models on Single-Lead ECG and PPG

ECG と PPG の同期データから構成される新しいベンチマーク「SignalMC-MED」を提案し、バイオシグナル基盤モデルの評価においてドメイン特化モデルの有効性、マルチモーダル融合の優位性、および手動特徴量と学習表現の相補性を明らかにした。

Fredrik K. Gustafsson, Xiao Gu, Mattia Carletti, Patitapaban Palo, David W. Eyre, David A. Clifton2026-03-11🤖 cs.LG

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

本論文は、PPO における学習率の不適切な設定が隠れ層ニューロンの活性化パターンに与える影響を「過学習・未学習指標（OUI）」で定量化し、トレーニング初期段階で学習率の良否を高精度に判定し不要な学習を早期に剪定できる手法を提案しています。

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

この論文は、LLM をファインチューニングまたはゼロから学習させることで、ブレークポイント設定やステップ実行などの対話的制御を可能にする「ニューラルデバッガー」を提案し、CruxEval における高い性能と、将来的な自律型コーディングシステムにおける世界モデルとしての基盤性を示しています。

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer

この論文は、行列演算子ノルムの幾何学的解釈に基づき、層ごとの合成性と幅に依存しない滑らかさの保証を実現する新しい平均正規化ノルムを導入し、これによりモデル幅を超えた学習率の安定した転送を可能にする新しい最適化手法「MOGA」を提案し、大規模な事前学習実験で Muon と同等以上の性能と高速性を示したことを報告しています。

Ruihan Xu, Jiajin Li, Yiping Lu2026-03-11🤖 cs.LG

← 前へ次へ →

cs.LG