cs.LG 件の論文 | Gist.Science

CN-CBF: Composite Neural Control Barrier Function for Safe Robot Navigation in Dynamic Environments

この論文は、動的環境における安全なロボットナビゲーションを実現するため、ハミルトン・ヤコビの到達可能性枠組みで訓練された複数のニューラル制御バリア関数を合成し、残差ニューラルアーキテクチャを用いて安全性を保証する「CN-CBF」という手法を提案し、シミュレーションおよびハードウェア実験で既存手法を上回る成功率を達成したことを報告しています。

Bojan Derajic, Sebastian Bernhard, Wolfgang Hönig2026-03-10🤖 cs.LG

NerVE: Nonlinear Eigenspectrum Dynamics in LLM Feed-Forward Networks

本論文は、大規模言語モデルのフィードフォワードネットワークにおける高次元動的な情報フローを、スペクトルエントロピーや参加率などの 4 つの指標を用いた「NerVE」と呼ばれる統一された固有スペクトル解析フレームワークを通じて解明し、モデルの汎化性能や設計選択との関連性を示すことで、試行錯誤に頼らないアーキテクチャやオプティマイザの最適化を可能にすることを提案しています。

Nandan Kumar Jha, Brandon Reagen2026-03-10🤖 cs.LG

Swimba: Switch Mamba Model Scales State Space Models

本論文は、状態空間モデル（SSM）の計算コストを増大させずに専門性を導入する「Switch Mamba（Swimba）」を提案し、パラメータ空間でエキスパートを混合する設計が、再帰計算のコストを固定したまま SSM の容量を拡張できることを理論的・実証的に示しています。

Zhixu Du, Krishna Teja Chitty-Venkata, Murali Emani, Venkatram Vishwanath, Hai Helen Li, Yiran Chen2026-03-10🤖 cs.LG

Physics-Consistent Neural Networks for Learning Deformation and Director Fields in Microstructured Media with Loss-Based Validation Criteria

この論文は、コシラ弾性理論に基づく微細構造媒体の力学挙動を解析するため、変形とディレクター場を独立に表現しフレーム不変性を満たす物理整合性ニューラルネットワークを開発し、準凸性やレジェンドル・ハダマード不等式などの安定性条件を損失関数として組み込むことで、エネルギー最小化解の物理的妥当性を検証する新しい計算手法を提案している。

Milad Shirani, Pete H. Gueldner, Murat Khidoyatov, Jeremy L. Warren, Federica Ninno2026-03-10🤖 cs.LG

Joint MDPs and Reinforcement Learning in Coupled-Dynamics Environments

この論文は、複数の行動に対する反事実的な結果の結合分布を明示的にモデル化する「結合マルコフ決定過程（JMDP）」を提案し、その枠組み内で n 次リターンモーメントに対するベルマン演算子を導出することで、収束保証付きの動的計画法および増分アルゴリズムを実現するものである。

Ege C. Kaya, Mahsa Ghasemi, Abolfazl Hashemi2026-03-10🤖 cs.LG

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

本論文は、DNABERT-2、Evo 2、NTv2 といった DNA 基盤モデルから生成された埋め込み表現が、モデル逆転攻撃によって元の遺伝子配列を再構築される脆弱性を有しており、特にトークン単位の埋め込みではほぼ完全な復元が可能であることを実証し、遺伝子データ共有におけるプライバシー保護の重要性を指摘しています。

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Not All Neighbors Matter: Understanding the Impact of Graph Sparsification on GNN Pipelines

この論文は、大規模グラフにおける GNN パイプラインのボトルネックであるデータ移動コストを軽減しつつ、ノード分類タスクの精度を維持または向上させることを示すため、グラフスパース化が軽量な前処理として有効であることを体系的に検証した研究です。

Yuhang Song, Naima Abrar Shami, Romaric Duvignau, Vasiliki Kalavri2026-03-10🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

本論文は、ベースモデルのサポートを超える際に生じる「尤度分位（LQ）」という障壁を明らかにし、出力報酬を用いた方策勾配法が次元の呪いに直面するのに対し、プロセス報酬モデルを用いることでトークンレベルの LQ に依存し、次元の呪いを回避して最適に学習できることを示しています。

Alireza Mousavi-Hosseini, Murat A. Erdogdu2026-03-10🤖 cs.LG

Chart-RL: Generalized Chart Comprehension via Reinforcement Learning with Verifiable Rewards

本論文は、数学的に検証可能な報酬を用いた強化学習手法「Chart-RL」を提案し、これにより既存の教師あり微細調整（SFT）を上回る性能でチャートの理解と推論能力を大幅に向上させ、少量の複雑なデータでも大規模な単純データよりも優れた汎化性能と他領域への転移能力を実現することを示しています。

Xin Zhang, Xingyu Li, Rongguang Wang, Ruizhong Miao, Zheng Wang, Dan Roth, Chenyang Li2026-03-10🤖 cs.LG

Learning Quadruped Walking from Seconds of Demonstration

この論文は、四足歩行の限界サイクルやポアンカレ写像の構造に基づく原理的分析から、数秒のデモンストレーションのみでオフライン学習により頑健な歩行制御ポリシーをゼロから学習する新しい模倣学習手法を提案し、ハードウェア実験でその有効性を実証しています。

Ruipeng Zhang, Hongzhan Yu, Ya-Chien Chang, Chenghao Li, Henrik I. Christensen, Sicun Gao2026-03-10🤖 cs.LG

A SISA-based Machine Unlearning Framework for Power Transformer Inter-Turn Short-Circuit Fault Localization

本論文は、センサー故障などの有害データが機械学習モデルの性能を低下させる問題に対し、学習データを分割・独立訓練する SISA 手法を採用し、汚染データの影響を最小限に抑えつつ全モデルの再学習を回避して電力変圧器の巻線間短絡故障を高精度に特定する機械学習の忘却フレームワークを提案しています。

Nanhong Liu, Jingyi Yan, Mucun Sun, Jie Zhang2026-03-10🤖 cs.LG

Topology-Aware Reinforcement Learning over Graphs for Resilient Power Distribution Networks

この論文は、極端な気象やサイバー攻撃による停電に備え、トポロジデータ分析（特に永続ホモロジー）をグラフ強化学習に組み込むことで、配電網の再構成と負荷遮断を最適化し、エネルギー供給の最大化と電圧違反の低減を実現する自律的な復旧フレームワークを提案しています。

Roshni Anna Jacob, Prithvi Poddar, Jaidev Goel, Souma Chowdhury, Yulia R. Gel, Jie Zhang2026-03-10🤖 cs.LG

Conditional Unbalanced Optimal Transport Maps: An Outlier-Robust Framework for Conditional Generative Modeling

この論文は、従来の条件付き最適輸送が持つ外れ値への敏感性という課題を解決するため、条件付き分布の整合制約を緩和する「条件付きアンバランス最適輸送（CUOT）」フレームワークと、それに基づく外れ値に頑健な生成モデル「CUOTM」を提案し、理論的裏付けと実験による有効性を示したものです。

Jiwoo Yoon, Kyumin Choi, Jaewoong Choi2026-03-10🤖 cs.LG

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

本論文は、一般和マルチエージェント強化学習において、プレイヤーに依存しないポテンシャル関数を学習することで混合協調・競争環境における近似ナッシュ均衡を効率的に計算する新しいパイプライン「NePPO」を提案し、既存手法よりも優れた性能を実証したものである。

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay Maheshwari2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

この論文は、拡散モデルの制御を統一的な制御理論の枠組み（LS-MDP）として再解釈し、これに基づいて事前学習済みモデルのバックボーンを凍結したまま軽量なサイドネットワークで効率的に微調整を行う「Diffusion Controller（DiffCon）」という新たな手法とアルゴリズムを提案し、Stable Diffusion における生成品質と効率性の両面で既存手法を上回る性能を実証したものである。

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

この論文は、因果的公平性の評価において平均処置効果（ATE）のみに依存する規制が、交絡変数によって「因果的マスキング」を引き起こし、見かけ上の公平性を維持しながら実質的な不平等を隠蔽する深刻なリスクを有することを示し、モデルレベルでの公平性規制の必要性を説いています。

Zou Yang, Sophia Xiao, Bijan Mazaheri2026-03-10🤖 cs.LG

Adaptive Discovery of Interpretable Audio Attributes with Multimodal LLMs for Low-Resource Classification

本論文は、マルチモーダル大規模言語モデル（MLLM）を用いて人間を代替し、低リソース音声分類タスクにおいて高速かつ解釈可能な音声属性を適応的に発見する手法を提案し、従来の人間依存型アプローチや直接予測よりも高い性能と実用性を示したことを述べています。

Kosuke Yoshimura, Hisashi Kashima2026-03-10🤖 cs.LG

Combinatorial Allocation Bandits with Nonlinear Arm Utility

本論文は、マッチングプラットフォームにおける参加者の不満や離脱を防ぐために、アームの満足度を最大化する新たなオンライン学習問題「組合せ割り当てバンドット」を提案し、そのために上界信頼区間法と Thompson サンプリング法を開発して近似後悔の理論的保証と実験的有効性を示したものである。

Yuki Shibukawa, Koichi Tanaka, Yuta Saito, Shinji Ito2026-03-10🤖 cs.LG

Can Safety Emerge from Weak Supervision? A Systematic Analysis of Small Language Models

この論文は、自動化された評価モデルからの弱い教師信号を用いた「Self-MOA」というフレームワークを提案し、小規模言語モデルが従来の人間によるアノテーションに依存することなく、安全性と有用性を両立させながら効率的にアライメントできることを実証しています。

Punyajoy Saha, Sudipta Halder, Debjyoti Mondal, Subhadarshi Panda2026-03-10🤖 cs.LG

TEA-Time: Transporting Effects Across Time

この論文は、無作為化比較試験の結果を異なる時期に外挿するための「TEA-Time」フレームワークを提案し、複製試験や共通治療群を用いた二つの識別戦略と二重頑健推定量を開発し、Upworthy の A/B テストデータを用いて、共通治療群アプローチが精度向上をもたらす一方で異質的な相互作用によるバイアスリスクがあることを示しています。

Harsh Parikh, Gabriel Levin-Konigsberg, Dominique Perrault-Joncas, Alexander Volfovsky2026-03-10🤖 cs.LG

← 前へ次へ →