cs.LG 件の論文 | Gist.Science

Estimating condition number with Graph Neural Networks

この論文では、スパース行列の条件数を高速に推定するために、効率的な特徴量設計とグラフニューラルネットワーク（GNN）を活用した新たな手法を提案し、Hager-Higham 法や Lanczos 法と比較して大幅な高速化を実現したことを示しています。

Erin Carson, Xinye Chen2026-03-12🤖 cs.LG

Robust Post-Training for Generative Recommenders: Why Exponential Reward-Weighted SFT Outperforms RLHF

この論文は、ノイズのあるユーザーフィードバックやプロパティスコアの欠如といった課題に直面する大規模生成型レコメンデーションシステムにおいて、報酬モデルの学習を不要とし、理論的保証を持つ「指数関数的報酬重み付け SFT」が、従来の RLHF 手法よりもロバストかつ効果的にユーザー嗜好に適合できることを示しています。

Keertana Chidambaram, Sanath Kumar Krishnamurthy, Qiuling Xu, Ko-Jen Hsiao, Moumita Bhattacharya2026-03-12🤖 cs.LG

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

この論文は、ADMM 反復とスコアベースの去噪器の間の manifolds の不一致を解消し、収束性を保証する新しい「AC-DC 去噪器」を組み込んだプラグアンドプレイフレームワークを提案し、逆問題における解の品質向上を実証しています。

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

GSVD for Geometry-Grounded Dataset Comparison: An Alignment Angle Is All You Need

この論文は、幾何学的構造を尊重する学習の観点から一般化特異値分解（GSVD）を用いて2つのデータセットを比較し、各サンプルがどちらのデータセットに由来するかを定量化する解釈可能な「角度スコア」を提案し、MNIST における診断ツールとしての有効性を示しています。

Eduarda de Souza Marques, Arthur Sobrinho Ferreira da Rocha, Joao Paixao, Heudson Mirandola, Daniel Sadoc Menasche2026-03-12🤖 cs.LG

Copula-ResLogit: A Deep-Copula Framework for Unobserved Confounding Effects

この論文は、Copula-ResLogit と呼ばれる深層学習とコピュラモデルを統合した新しいフレームワークを提案し、交通需要分析における観測されない交絡因子による非因果的依存関係を検出・軽減することで、真の因果効果を明らかにする手法を示しています。

Kimia Kamal, Bilal Farooq2026-03-12🤖 cs.LG

MultiwayPAM: Multiway Partitioning Around Medoids for LLM-as-a-Judge Score Analysis

LLM による評価スコアにおける計算コストとバイアスの課題を解決し、評価スコアテンソルの構造を解明するため、質問・回答者・評価者の各モードに対してクラスタ所属と代表点（メドイド）を同時に推定する新しいテンソルクラスタリング手法「MultiwayPAM」を提案し、その有効性を実データで実証した。

Chihiro Watanabe, Jingyu Sun2026-03-12📊 stat

Quantum entanglement provides a competitive advantage in adversarial games

この論文は、Pong という競争的マルコフゲームにおける量子古典ハイブリッドエージェントの実験を通じて、量子もつれが表現学習に不可欠なリソースとして機能し、分離可能な回路や古典的なニューラルネットワークを凌駕する競争優位性をもたらすことを実証しています。

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

この論文は、人間の記憶の構造と自己進化の特性に着想を得て、離散的高レベル記号ノードと連続的軌道埋め込みを結合したグラフベースのハイブリッド自己進化構造化メモリ「HyMEM」を提案し、これによりオープンソースの GUI エージェントが強力なクローズドソースモデルと同等かそれ以上の性能を発揮することを示しています。

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

GaLoRA: Parameter-Efficient Graph-Aware LLMs for Node Classification

GaLoRA は、テキスト属性グラフのノード分類タスクにおいて、フルファインチューニングの 0.24% のパラメータ数で最先端モデルと同等の性能を発揮する、構造化情報を大規模言語モデルに効率的に統合するパラメータ効率型フレームワークです。

Mayur Choudhary, Saptarshi Sengupta, Katerina Potika2026-03-12🤖 cs.LG

Regime-aware financial volatility forecasting via in-context learning

この論文は、パラメータの微調整を行わずに事前学習済み大規模言語モデル（LLM）を用いて市場のレジームを推定し、条件付きで選択されたデモンストレーションを文脈に組み込むことで、非定常な市場環境下における金融ボラティリティの予測精度を向上させる「レジーム対応型インコンテキスト学習フレームワーク」を提案するものである。

Saba Asaad, Shayan Mohajer Hamidi, Ali Bereyhi2026-03-12🤖 cs.LG

What do near-optimal learning rate schedules look like?

この論文は、学習率スケジュールの形状を最適化する探索手法を提案し、ウォームアップと減衰が重要であることを示しつつ、既存のスケジュールが最適ではないことと、重み減衰が最適な形状に強い影響を与えることを明らかにしました。

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, George E. Dahl2026-03-12🤖 cs.LG

How to make the most of your masked language model for protein engineering

本論文は、抗体治療薬の設計において、マスク言語モデルから目的の生物学的特性を最適化するための柔軟かつ効果的なサンプリング手法（確率的ビームサーチ）を提案し、その有効性を計算機シミュレーションおよび実際の抗体エンジニアリング実験を通じて実証したものである。

Calvin McCarter, Nick Bhattacharya, Sebastian W. Ober, Hunter Elliott2026-03-12🧬 q-bio

Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

この論文は、非局所的な情報集約と局所的な非線形予測を明示的に分離する「データ駆動型積分カーネル」という枠組みを導入することで、気候プロセスの学習における解釈性と過学習の課題を解決し、南アジアのモンスーン降水量予測において、パラメータ数を大幅に削減しながら高い予測精度を達成する手法を提案しています。

Savannah L. Ferretti, Jerry Lin, Sara Shamekh, Jane W. Baldwin, Michael S. Pritchard, Tom Beucler2026-03-12🤖 cs.LG

NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction

NasoVoce は、スマートグラスの鼻架に装着されたマイクと振動センサーを融合させることで、環境雑音に強くかつ低音量の発話も認識可能な、常時利用可能な静かな音声対話インターフェースの実現を提案する研究です。

Jun Rekimoto, Yu Nishimura, Bojian Yang2026-03-12🤖 cs.AI

Federated Active Learning Under Extreme Non-IID and Global Class Imbalance

この論文は、極端な非 IID 環境とグローバルなクラス不均衡下におけるフェデレーテッド・アクティブ・ラーニングの課題を解決するため、グローバルとローカルなモデルの適応的選択やクラス公平性を重視したサンプリング戦略を採用し、既存手法を上回る性能を示す「FairFAL」という新しいフレームワークを提案しています。

Chen-Chen Zong, Sheng-Jun Huang2026-03-12🤖 cs.LG

On The Complexity of Best-Arm Identification in Non-Stationary Linear Bandits

この論文は、非定常線形バンディット問題における固定予算ベストアーム同定（BAI）の複雑性を研究し、従来の次元に比例する複雑度評価の限界を克服するアーム集合依存の下限を導出するとともに、これに基づいて提案された「Adjacent-BAI」アルゴリズムがその下限と一致する誤り確率を達成することを証明し、アーム集合の幾何学的構造に依存した最適複雑性を確立したものである。

Leo Maynard-Zhang, Zhihan Xiong, Kevin Jamieson, Maryam Fazel2026-03-12📊 stat

HEAL: Hindsight Entropy-Assisted Learning for Reasoning Distillation

本論文は、教師モデルの失敗例を排除する従来の限界を克服し、教育理論の「最近接発達領域」に基づいて、エントロピーに基づく修復や段階的カリキュラム学習を組み合わせる RL フリーのフレームワーク「HEAL」を提案し、大規模推論モデルから小規模モデルへの推論能力の蒸留を大幅に改善することを示しています。

Wenjing Zhang, Jiangze Yan, Jieyun Huang, Yi Shen, Shuming Shi, Ping Chen, Ning Wang, Zhaoxiang Liu, Kai Wang, Shiguo Lian2026-03-12🤖 cs.AI

Causal Concept Graphs in LLM Latent Space for Stepwise Reasoning

この論文は、スパースオートエンコーダと微分可能な構造学習を組み合わせることで大規模言語モデルの潜在空間に因果概念グラフを構築し、多段階推論における概念間の因果依存関係を可視化するとともに、介入実験による評価スコア（CFS）で既存手法を上回る性能を実証する手法を提案しています。

Md Muntaqim Meherab, Noor Islam S. Mohammad, Faiza Feroz2026-03-12🤖 cs.LG

Optimal Expert-Attention Allocation in Mixture-of-Experts: A Scalable Law for Dynamic Model Design

この論文は、Mixture-of-Experts（MoE）モデルにおいて、トータルな計算量とスパース性に応じてエキスパート層とアテンション層への計算リソース配分を最適化するべき比率をべき乗則として導き出し、Chinchilla の法則を拡張したスケーリング法則を提案するものである。

Junzhuo Li, Peijie Jiang, Changxin Tian, Jia Liu, Zhiqiang Zhang, Xuming Hu2026-03-12🤖 cs.LG

Variance-Aware Adaptive Weighting for Diffusion Model Training

この論文は、拡散モデルの訓練におけるノイズレベルごとの損失分散の偏りに着目し、分散に応じた適応的重み付け戦略を提案することで、CIFAR-10 や CIFAR-100 において FID の改善と訓練の安定化を実現したことを報告しています。

Nanlong Sun, Lei Shi2026-03-12🤖 cs.LG

← 前へ次へ →