cs.LG 件の論文 | Gist.Science

A Trust-Region Interior-Point Stochastic Sequential Quadratic Programming Method

本論文は、確率的な目的関数と決定論的な非線形制約条件を持つ最適化問題に対して、適応的な精度条件を満たす確率的オラクルと内点法を組み合わせた新しい「TR-IP-SSQP」手法を提案し、その第一-order 停留点への大域的な収束性を理論的に証明するとともに、CUTEst テストセットやロジスティック回帰問題への適用を通じて実用性を示したものである。

Yuchen Fang, Jihun Kim, Sen Na, James Demmel, Javad Lavaei2026-03-12🔢 math

Why Does It Look There? Structured Explanations for Image Classification

この論文は、既存の XAI 手法から抽出したプロトタイプを用いて訓練過程の進展を定量化し、モデルの判断根拠を構造化された形で説明すると同時に、不確実なプロトタイプを特定してターゲットとした摂動を加えることでモデルの精度向上を実現するフレームワーク「I2X」を提案しています。

Jiarui Li, Zixiang Yin, Samuel J Landry, Zhengming Ding, Ramgopal R. Mettu2026-03-12🤖 cs.LG

One Adapter for All: Towards Unified Representation in Step-Imbalanced Class-Incremental Learning

本論文は、タスクごとのクラス数が大きく変動する「ステップ不均衡」なクラスインクリメンタル学習の課題に対し、大規模タスクの支配的なサブスペースを維持しつつ小規模タスクの不安定な更新を抑制する非対称な部分空間アライメントと方向性ゲート機構を採用し、単一のアダプタで効率的かつ安定した学習を実現する「One-A」フレームワークを提案するものである。

Xiaoyan Zhang, Jiangpeng He2026-03-12🤖 cs.LG

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

この論文は、偏微分方程式を解くためのスパイク型ニューロモルフィックアルゴリズムが、最大 32% のニューロン欠損や 90% のスパイク欠落に対しても精度を維持する構造的な頑健性と耐故障性を有し、その耐性が構造的ハイパーパラメータによって調整可能であることを実証しています。

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

SiMPO: Measure Matching for Online Diffusion Reinforcement Learning

本論文は、拡散モデルを用いた強化学習において、負のサンプルからのフィードバックを有効活用し過剰な貪欲性を抑制するため、符号付き測度を用いたマッチングと任意の単調増加重み付け関数を一般化した新しいフレームワーク「SiMPO」を提案し、その理論的正当性と実証的な優位性を示すものである。

Haitong Ma, Chenxiao Gao, Tianyi Chen, Na Li, Bo Dai2026-03-12🤖 cs.LG

Bayesian Hierarchical Models and the Maximum Entropy Principle

この論文は、ハイパーパラメータに条件付けた事前分布が最大エントロピー分布（canonical distribution）である場合、ハイパーパラメータを積分して得られるパラメータの周辺事前分布も、未知量の関数の周辺分布に関する異なる制約のもとで最大エントロピー性を満たすことを示し、階層モデルを割り当てる際に仮定されている情報の本質を明らかにするものである。

Brendon J. Brewer2026-03-12📊 stat

Improving TabPFN's Synthetic Data Generation by Integrating Causal Structure

本論文は、特徴量の順序に依存する TabPFN の生成プロセスに因果構造（DAG または CPDAG）を統合することで、偽の相関を排除し、合成データの質と因果効果の保存性を向上させる手法を提案し、その有効性を検証したものである。

Davide Tugnoli, Andrea De Lorenzo, Marco Virgolin, Giovanni Cinà2026-03-12🤖 cs.LG

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

この論文は、単細胞基礎モデル「scGPT」の内部機構を解明し、その注意機構から造血系に特化した高性能なコンパクトなアルゴリズムを抽出・実証した世界初の研究であり、既存手法を上回る精度と効率性を達成したことを報告しています。

Ihor Kendiukhov2026-03-12🧬 q-bio

From Prior to Pro: Efficient Skill Mastery via Distribution Contractive RL Finetuning

この論文は、事前学習された生成ロボット方策をオンラインフィードバックから成功行動を強化する「分布収縮」オペレーターとして機能する強化学習フレームワーク「DICE-RL」を導入し、シミュレーションおよび実ロボットにおいて高次元の画素入力から複雑な長期操作スキルの効率的な習得を実現することを提案しています。

Zhanyi Sun, Shuran Song2026-03-12🤖 cs.LG

Estimating condition number with Graph Neural Networks

この論文では、スパース行列の条件数を高速に推定するために、効率的な特徴量設計とグラフニューラルネットワーク（GNN）を活用した新たな手法を提案し、Hager-Higham 法や Lanczos 法と比較して大幅な高速化を実現したことを示しています。

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

この論文は、ノイズのあるユーザーフィードバックやプロパティスコアの欠如といった課題に直面する大規模生成型レコメンデーションシステムにおいて、報酬モデルの学習を不要とし、理論的保証を持つ「指数関数的報酬重み付け SFT」が、従来の RLHF 手法よりもロバストかつ効果的にユーザー嗜好に適合できることを示しています。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

この論文は、ADMM 反復とスコアベースの去噪器の間の manifolds の不一致を解消し、収束性を保証する新しい「AC-DC 去噪器」を組み込んだプラグアンドプレイフレームワークを提案し、逆問題における解の品質向上を実証しています。

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

この論文は、幾何学的構造を尊重する学習の観点から一般化特異値分解（GSVD）を用いて2つのデータセットを比較し、各サンプルがどちらのデータセットに由来するかを定量化する解釈可能な「角度スコア」を提案し、MNIST における診断ツールとしての有効性を示しています。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

この論文は、Copula-ResLogit と呼ばれる深層学習とコピュラモデルを統合した新しいフレームワークを提案し、交通需要分析における観測されない交絡因子による非因果的依存関係を検出・軽減することで、真の因果効果を明らかにする手法を示しています。

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

LLM による評価スコアにおける計算コストとバイアスの課題を解決し、評価スコアテンソルの構造を解明するため、質問・回答者・評価者の各モードに対してクラスタ所属と代表点（メドイド）を同時に推定する新しいテンソルクラスタリング手法「MultiwayPAM」を提案し、その有効性を実データで実証した。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

この論文は、Pong という競争的マルコフゲームにおける量子古典ハイブリッドエージェントの実験を通じて、量子もつれが表現学習に不可欠なリソースとして機能し、分離可能な回路や古典的なニューラルネットワークを凌駕する競争優位性をもたらすことを実証しています。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

この論文は、人間の記憶の構造と自己進化の特性に着想を得て、離散的高レベル記号ノードと連続的軌道埋め込みを結合したグラフベースのハイブリッド自己進化構造化メモリ「HyMEM」を提案し、これによりオープンソースの GUI エージェントが強力なクローズドソースモデルと同等かそれ以上の性能を発揮することを示しています。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

GaLoRA は、テキスト属性グラフのノード分類タスクにおいて、フルファインチューニングの 0.24% のパラメータ数で最先端モデルと同等の性能を発揮する、構造化情報を大規模言語モデルに効率的に統合するパラメータ効率型フレームワークです。

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

この論文は、パラメータの微調整を行わずに事前学習済み大規模言語モデル（LLM）を用いて市場のレジームを推定し、条件付きで選択されたデモンストレーションを文脈に組み込むことで、非定常な市場環境下における金融ボラティリティの予測精度を向上させる「レジーム対応型インコンテキスト学習フレームワーク」を提案するものである。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

この論文は、学習率スケジュールの形状を最適化する探索手法を提案し、ウォームアップと減衰が重要であることを示しつつ、既存のスケジュールが最適ではないことと、重み減衰が最適な形状に強い影響を与えることを明らかにしました。

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

← 前へ次へ →