cs.LG 件の論文 | Gist.Science

Dual Randomized Smoothing: Beyond Global Noise Variance

この論文は、入力依存のノイズ分散を可能にする「二重ランダム化平滑化」フレームワークを提案し、従来のグローバル分散の限界を克服して小・大半径の両方において高い頑健性を達成する手法を提示しています。

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

この論文は、クロスドメインオフライン強化学習における訓練時とテスト時の両方の動的シフトに対する頑健性を向上させるため、新しいロバスト・ベルマン演算子と二つの補正技術を組み合わせた「DROCO」というアルゴリズムを提案し、その有効性を示しています。

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

この論文は、最適化と生成を分離するという構造的な原則に基づき、表現力豊かな生成モデルとオンライン強化学習の安定性を両立させる新しいフレームワーク「GoRL」を提案し、複雑な連続制御タスクにおいて既存の手法を大幅に上回る性能を達成したことを報告しています。

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

この論文は、非加法的な現実世界の報酬構造や高次元のスパース性を扱うために、単一化された非線形説明フレームワーク「疎性等方性シャプレー回帰（SISR）」を提案し、単調変換の学習とスパース性制約を同時に実行することで、既存のシャプレー値の歪みを解消し、理論的保証と高い実用性を両立させることを示しています。

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

制約されたリソースとデータ制約下で、ルールベースのマスク変形と GAN による画像変換を組み合わせる二段階のデータ拡張フレームワークを提案し、限られたデータ量でもマスク付き顔検出・認識タスクにおいて既存手法を上回る結果を示した研究です。

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

本論文は、スパースオートエンコーダと勾配ベースの可視化手法を統合し、深層学習モデルの内部特徴を「発見・検証・制御」する SALVE 枠組みを提案することで、モデルの透明性と制御性を高める新たな手法を提示しています。

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

本論文は、エピソード横断的なトレーニングとリフレクションによるコンテキスト内方策適応という 2 つの主要な構成要素を備えたメタ強化学習フレームワーク「LaMer」を提案し、これにより言語エージェントが環境からのフィードバックに基づいて能動的に探索し、従来の強化学習ベースラインよりも Sokoban や Webshop などのタスクで顕著な性能向上と汎化能力を実現することを示しています。

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

本論文は、拡散モデルの事前知識と形状からの陰影（SfS）の手がかりを組み合わせ、推論時に自己教師ありで再照明を行う「Re-Depth Anything」を提案し、Depth Anything V2 や V3 の推定深度をラベルなしで高精度かつリアルに洗練させる手法を提示するものである。

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

本論文は、逐次的な制約により並列化が困難だったニュートン・カチャルツ法に基づくコルモゴロフ・アルノルドネットワークの学習アルゴリズムに対し、事前学習、データ分割によるモデル統合、およびFPGA実装という3つの戦略を提案することで、並列処理による大幅な高速化を実現したことを示しています。

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection

この論文は、高次元の表形式データにおける分布外（OOD）異常検出の一般化崩壊問題を解決するため、トポロジカルな多様体構造の明示的な整形と確率的密度推定を分離する階層的な「Latent Sculpting」手法を提案し、ゼロショット設定で未知のサイバー攻撃に対する高い検出性能を実証しています。

Rajeeb Thapa Chhetri, Saurab Thapa, Avinash Kumar, Zhixiong Chen2026-03-10🤖 cs.LG

Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning

本論文は、垂直フェデレーティングラーニングにおける「忘れられる権利」に対応するため、特定のサンプルやラベルの影響を効率的に除去し、再学習と同等の性能を低コストで実現する新たなプリマル・デュアル最適化手法「FedORA」を提案し、その理論的保証と実証的有効性を示したものである。

Yu Jiang, Xindi Tong, Ziyao Liu, Xiaoxi Zhang, Kwok-Yan Lam, Chee Wei Tan2026-03-10🤖 cs.LG

Network Traffic Analysis with Process Mining: The UPSIDE Case Study

本論文は、オンラインゲームのネットワークトラフィックをプロセスマイニングを用いて分析し、非教師ありで状態を特定し、解釈可能なペトリネットとして符号化するとともに、異なるゲームの分類精度を向上させる手法を、Clash Royale と Rocket League のデータを用いた UPSIDE ケーススタディで実証したものである。

Francesco Vitale, Paolo Palmiero, Massimiliano Rak, Nicola Mazzocca2026-03-10🤖 cs.LG

Topological Spatial Graph Coarsening

本論文は、空間グラフのトポロジカル特徴を保持しつつノード数を削減するパラメータ不要の手法を提案し、三角形を考慮した新しいフィルトレーションに基づく永続的図の適応と、回転・並進・スケーリングに対する等変性を保証する理論的性質を特徴とする。

Anna Calissano, Etienne Lasalle2026-03-10🤖 cs.LG

Sparse Offline Reinforcement Learning with Corruption Robustness

この論文は、高次元かつスパースなマルコフ決定過程におけるオフライン強化学習において、従来の手法では困難だった単一方策集中性条件下での汚染耐性を持つ Actor-Critic 法を提案し、汚染データが存在する状況でも近最適方策の学習を保証する初の非自明な理論的保証を提供するものである。

Nam Phuong Tran, Andi Nika, Goran Radanovic, Long Tran-Thanh, Debmalya Mandal2026-03-10🤖 cs.LG

Group Cross-Correlations with Faintly Constrained Filters

この論文は、非可換群に対する群畳み込みニューラルネットワークにおいて、非コンパクトな安定化群を持つ群作用との互換性を解決し、非推移的な作用や非ユニモジュラーな群にも一般化された、より弱い制約を持つフィルタを提案し、必要なノード数を削減する手法を確立するものである。

Benedikt Fluhr2026-03-10🤖 cs.LG

Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems

本論文は、電力系統の安全に不可欠な負荷予測において、従来の精度指標では捉えきれない過小予測リスクを定量化する新たな評価枠組みを提案し、気象情報の統合と制約付き最適化によって、過剰な予備容量を招く「偽の安全性」を排除しつつ信頼性の高い予測を実現する手法を確立したものである。

Sunki Hong, Jisoo Lee2026-03-10⚡ eess

From Mice to Trains: Amortized Bayesian Inference on Graph Data

本論文は、生物学や物流などの多様なドメインにおけるグラフ構造データに対して、置換不変性を備えた要約ネットワークと事後推定ネットワークを組み合わせることで、ノード・エッジ・グラフレベルのパラメータに対する迅速かつ校正されたベイズ推論を可能にする、アモルタイズドベイズ推論の新しい枠組みを提案し、その有効性を検証したものである。

Svenja Jedhoff, Elizaveta Semenova, Aura Raulo, Anne Meyer, Paul-Christian Bürkner2026-03-10🤖 cs.LG

DevBench: A Realistic, Developer-Informed Benchmark for Code Generation Models

DevBench は、開発者のテレメトリデータに基づき 6 つのプログラミング言語と 6 つのタスクカテゴリで構成された大規模言語モデルのコード生成能力を、機能性や実用性などの多角的な観点から評価する、生態学的妥当性と詳細な診断機能を備えた新しいベンチマークです。

Pareesa Ameneh Golnari, Adarsh Kumarappan, Wen Wen, Xiaoyu Liu, Gabriel Ryan, Yuting Sun, Shengyu Fu, Elsie Nallipogu2026-03-10🤖 cs.LG

A Component-Based Survey of Interactions between Large Language Models and Multi-Armed Bandits

この論文は、大規模言語モデル（LLM）と多腕バンディット（MAB）アルゴリズムが、コンポーネントレベルで双方向的に相互作用し、それぞれが他方の課題を解決または能力を向上させる可能性を初めて体系的に調査した包括的なレビューである。

Siguang Chen, Chunli Lv, Miao Xie2026-03-10🤖 cs.LG

ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over the Network Edge

この論文は、リソース制約のあるエッジ環境における大規模言語モデル（LLM）の分散ファインチューニング課題に対処するため、スプリット学習と階層型フェデレーテッド学習を統合し、クライアントクラスタリング、動的モデル分割、軽量通信スキームを備えた「ELSA」と呼ばれるプライバシー保護型の効率的なフレームワークを提案するものです。

Xiaohong Yang, Tong Xie, Minghui Liwang, Chikai Shang, Yang Lu, Zhenzhen Jiao, Liqun Fu, Seyyedali Hosseinalipour2026-03-10🤖 cs.LG

← 前へ次へ →