cs.LG 件の論文 | Gist.Science

Frequentist Consistency of Prior-Data Fitted Networks for Causal Inference

この論文は、事前データ適合ネットワーク（PFN）に基づく因果推定推定量が頻度論的整合性を欠く問題を指摘し、マルティンゲール事後分布を用いた一歩事後補正（OSPC）を導入することで、平均処置効果（ATE）の推定において頻度論的整合性と適切な不確実性定量化を回復させる手法を提案しています。

Valentyn Melnychuk, Vahid Balazadeh, Stefan Feuerriegel, Rahul G. Krishnan2026-03-13🤖 cs.LG

Slow-Fast Inference: Training-Free Inference Acceleration via Within-Sentence Support Stability

この論文は、文内や意味的に一貫した区間におけるアテンションサポートの安定性という観察に基づき、既存のモデルを再学習することなく推論コストを大幅に削減し、品質を維持しながらスループットを向上させるトレーニングフリーの「Slow-Fast Inference」フレームワークを提案しています。

Xingyu Xie, Zhaochen Yu, Yue Liao, Tao Wang, Kim-Chuan Toh, Shuicheng Yan2026-03-13🤖 cs.LG

Continual Learning with Vision-Language Models via Semantic-Geometry Preservation

本論文は、事前学習済み視覚言語モデルの継続学習において、対抗的アンカーと幾何学的蒸留を用いて新旧タスク間のセマンティック幾何構造を保存し、エクスンプラフリー制約下でカタストロフィックフォージングを抑制する「SeGP-CL」という手法を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。

Chiyuan He, Zihuan Qiu, Fanman Meng, Runtong Zhang, Linfeng Xu, Qingbo Wu, Hongliang Li2026-03-13🤖 cs.LG

Chemical Reaction Networks Learn Better than Spiking Neural Networks

この論文は、隠れ層を持たない化学反応ネットワークが、隠れ層を必要とするスパイクニューラルネットワークよりも優れた学習能力と分類精度を数学的に証明し、生化学的反応ネットワークが生物学的学習においてより効率的である可能性を示唆しています。

Sophie Jaffard, Ivo F. Sbalzarini2026-03-13📊 stat

A Multi-Label Temporal Convolutional Framework for Transcription Factor Binding Characterization

この論文は、転写因子の結合部位予測を単一の因子や二値分類ではなく、転写因子間の相関や協調的な制御メカニズムを捉える多ラベル分類問題として定式化し、時系列畳み込みネットワーク（TCN）を用いて生物学的に意味のあるモチーフや新たな共結合パターンを抽出する深層学習フレームワークを提案しています。

Pietro Demurtas, Ferdinando Zanchetta, Giovanni Perini, Rita Fioresi2026-03-13🧬 q-bio

Cross-Domain Policy Optimization via Bellman Consistency and Hybrid Critics

この論文は、ドメイン間の状態・行動空間の不一致と負の転移という課題を、転移可能性を測定する「クロスドメイン・ベルマン整合性」と、ソースおよびターゲットドメインの Q 関数を適応的に結合するハイブリッドクリティック「QAvatar」を導入することで解決し、効率的なクロスドメイン強化学習を実現する手法を提案しています。

Ming-Hong Chen, Kuan-Chen Pan, You-De Huang, Xi Liu, Ping-Chun Hsieh2026-03-13🤖 cs.LG

Resource-Efficient Iterative LLM-Based NAS with Feedback Memory

この論文は、単一のコンシューマー向け GPU 上で大規模言語モデル（LLM）の微調整なしに、履歴フィードバックメモリと双 LLM 特化アプローチを用いて効率的に画像分類用ニューラルネットワークを自動設計し、低予算かつ再現性のあるハードウェア認識型 NAS パラダイムを確立する手法を提案するものです。

Xiaojie Gu, Dmitry Ignatov, Radu Timofte2026-03-13🤖 cs.LG

Wasserstein Gradient Flows for Batch Bayesian Optimal Experimental Design

本論文は、バッチベイズ最適実験設計における非凸な最適化課題に対処するため、設計測度空間への確率的リフティングとエントロピー正則化を導入し、Wasserstein 勾配流に基づく粒子アルゴリズムを提案して、多峰性の最適化 landscapes を探索し高効用な実験バッチを効率的に生成する手法を確立したものである。

Louis Sharrock2026-03-13📊 stat

Taming the Adversary: Stable Minimax Deep Deterministic Policy Gradient via Fractional Objectives

本論文は、ユーザー方策と敵対的擾乱方策間のミニマックス最適化に分数目的関数を導入して安定化を図る「MMDDPG」という枠組みを提案し、連続制御タスクにおける外乱やモデル不確実性に対するロバスト性を大幅に向上させることを示しています。

Taeho Lee, Donghwan Lee2026-03-13🤖 cs.LG

Cornserve: A Distributed Serving System for Any-to-Any Multimodal Models

Cornserve は、任意のモダリティの入出力を可能とする Any-to-Any マルチモーダルモデルの計算グラフを柔軟に表現し、コンポーネントの分離と独立したスケーリングを実現することで、高いスループットと低いレイテンシを提供する分散推論システムです。

Jae-Won Chung, Jeff J. Ma, Jisang Ahn, Yizhuo Liang, Akshay Jajoo, Myungjin Lee, Mosharaf Chowdhury2026-03-13🤖 cs.LG

Hoi3DGen: Generating High-Quality Human-Object-Interactions in 3D

この論文は、マルチモーダル大規模言語モデルを活用して高品質な対話データを構築し、テキストから忠実かつ高品質な 3 次元の人間 - 物体相互作用メッシュを生成する新しいフレームワーク「Hoi3DGen」を提案し、既存手法を大幅に凌駕する性能を示したものである。

Agniv Sharma, Xianghui Xie, Tom Fischer, Eddy Ilg, Gerard Pons-Moll2026-03-13🤖 cs.LG

Automatic Generation of High-Performance RL Environments

この論文は、汎用的なプロンプトテンプレート、階層的検証、反復的エージェント支援修復という手法を用いて、数ヶ月の専門的エンジニアリングを要していた複雑な強化学習環境を、10 ドル未満の計算コストで高性能かつ意味的に同等な実装へ自動変換する画期的なレシピを提案し、5 つの環境における大幅な高速化とゼロのシミュレーション間ギャップを実証しています。

Seth Karten, Rahul Dev Appapogu, Chi Jin2026-03-13🤖 cs.LG

FlashMotion: Few-Step Controllable Video Generation with Trajectory Guidance

本論文は、従来の多段階生成モデルの時間的冗長性を解消しつつ、動画の画質と軌跡の精度を両立させるために、軌跡アダプターの事前学習、生成器の少ステップ化、そしてハイブリッドな微調整戦略を組み合わせた新しいフレームワーク「FlashMotion」と、その評価用ベンチマーク「FlashBench」を提案するものである。

Quanhao Li, Zhen Xing, Rui Wang, Haidong Cao, Qi Dai, Daoguo Dong, Zuxuan Wu2026-03-13🤖 cs.LG

IsoCompute Playbook: Optimally Scaling Sampling Compute for LLM RL

この論文は、大規模言語モデルの強化学習における計算リソースの最適配分を明らかにし、問題ごとの並列ロールアウト数を計算予算に応じて増やすことで、簡単な問題では解の鋭敏化を、難しい問題では探索範囲の拡大を促進し、効率的な学習を実現する実践的な指針を提供しています。

Zhoujun Cheng, Yutao Xie, Yuxiao Qu, Amrith Setlur, Shibo Hao, Varad Pimpalkhute, Tongtong Liang, Feng Yao, Zhengzhong Liu, Eric Xing, Virginia Smith, Ruslan Salakhutdinov, Zhiting Hu, Taylor Killian, Aviral Kumar2026-03-13🤖 cs.LG

A Quantitative Characterization of Forgetting in Post-Training

この論文は、二成分混合モデルを用いた理論的枠組みを構築し、KL 発散の方向性、幾何学的な行動の重なり、サンプリング戦略、および過去の行動の可視性が、生成モデルの継続的学習における「質量の消失」と「成分のドリフト」という 2 種類の忘却をどのように定量的に決定するかを明らかにしています。

Krishnakumar Balasubramanian, Shiva Prasad Kasiviswanathan2026-03-13📊 stat

Proof-Carrying Materials: Falsifiable Safety Certificates for Machine-Learned Interatomic Potentials

本論文は、単一の機械学習原子間ポテンシャルの信頼性不足を克服し、敵対的検証、ブートストラップ推定、Lean 4 による形式的証明の 3 段階プロセス「Proof-Carrying Materials」を導入することで、安定材料の発見率を 25% 向上させ、計算材料科学における安全性保証を実現する手法を提案しています。

Abhinaba Basu, Pavan Chakraborty2026-03-13🔬 cond-mat.mtrl-sci

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

本論文は、スパースアテンションにおけるクロスレイヤーのインデックス再利用を活用し、インデックス計算を最大 75% 削減しながら品質を維持し、プリフィル速度を最大 1.82 倍、デコード速度を 1.48 倍向上させる「IndexCache」という手法を提案しています。

Yushi Bai, Qian Dong, Ting Jiang, Xin Lv, Zhengxiao Du, Aohan Zeng, Jie Tang, Juanzi Li2026-03-13💬 cs.CL

HiAP: A Multi-Granular Stochastic Auto-Pruning Framework for Vision Transformers

本論文は、マクロおよびマイクロの両方の粒度で確率的なゲート機構を導入し、単一のエンドツーエンド学習フェーズで視覚トランスフォーマーの最適な部分ネットワークを自動的に発見する階層的自動プルーニングフレームワーク「HiAP」を提案し、複雑な多段階パイプラインを不要にしながらエッジデバイス向けの高精度かつ高効率なアーキテクチャを実現することを示しています。

Andy Li, Aiden Durrant, Milan Markovic, Georgios Leontidis2026-03-13🤖 cs.LG

Interpreting Contrastive Embeddings in Specific Domains with Fuzzy Rules

この論文は、医療記録や映画レビューなどの自由記述テキストをCLIPモデルの埋め込み空間にマッピングし、ファジィルールベースの分類システムを用いてドメイン固有の文脈を解釈する手法を提案し、その有効性と限界について議論するものである。

Javier Fumanal-Idocin, Mohammadreza Jamalifard, Javier Andreu-Perez2026-03-13🤖 cs.LG

Neural Thickets: Diverse Task Experts Are Dense Around Pretrained Weights

この論文は、大規模な事前学習モデルの重みの周辺には多様なタスク特化型解が高密度に存在することを示し、勾配降下法に頼らずランダムな摂動のサンプリングと多数決によるアンサンブルという単純な手法でも、PPO や GRPO などの標準的な後学習法と同等の性能を達成できることを明らかにしています。

Yulu Gan, Phillip Isola2026-03-13🤖 cs.LG

← 前へ次へ →