cs.LG 件の論文 | Gist.Science

Service Placement in Small Cell Networks Using Distributed Best Arm Identification in Linear Bandits

この論文は、小規模セルネットワークにおけるサービス配置問題を線形バンドット問題として定式化し、分散型最適腕識別アルゴリズムを提案することで、複数の小基地局が協調してユーザーの遅延を最小化する最適なエッジサービスを見出し、学習効率を向上させる手法を提示しています。

Mariam Yahya, Aydin Sezgin, Setareh Maghsudi2026-03-11🤖 cs.LG

Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes

この論文は、離散グロンワールの不等式のみを用いて、凸または非凸な目的関数における確率的勾配降下法（SGD）および確率的ヘビーボール法（SHB）の最終反復の収束率を、 $\gamma$ -Hölder 連続な勾配を持つ一般的な設定で導出・再証明したものである。

Marcel Hudiani2026-03-11🤖 cs.LG

Operator Learning for Consolidation: An Architectural Comparison for DeepONet Variants

この論文は、地盤沈下問題に対して物理情報を枝網ではなく幹網に組み込んだ改良型 DeepONet（モデル 3）とフーリエ特徴量強化版（モデル 4）を提案・評価し、特に 3 次元問題において従来のソルバーに比べ最大 1,000 倍の高速化を実現し、地盤工学における不確実性定量化の加速への可能性を示したものである。

Yongjin Choi, Chenying Liu, Jorge Macedo2026-03-11🤖 cs.LG

Langevin Flows for Modeling Neural Latent Dynamics

本論文は、慣性や減衰などの物理的プリアと局所結合発振器ネットワークを潜在空間のランジュバン流に組み込むことで、神経集団の複雑な動的構造と外部影響を高精度にモデル化し、合成データおよび実神経データにおいて既存手法を上回る性能を示した「LangevinFlow」と呼ばれる逐次変分オートエンコーダを提案しています。

Yue Song, T. Anderson Keller, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

この論文は、ロボットや人間など異なるエンボディメントからのデータを光フローを用いて事前学習した世界モデルと価値関数を活用し、ターゲットとなるロボットの実証データのみで微調整を行う「潜在ポリシー・ステアリング（LPS）」手法を提案し、低データ量環境でもビヘイビア・クローンベースの視覚運動ポリシーを大幅に改善することを示しています。

Yiqi Wang, Mrinal Verghese, Jeff Schneider2026-03-11🤖 cs.AI

Multimodal LLM-assisted Evolutionary Search for Programmatic Control Policies

この論文は、深層強化学習の透明性と検証可能性を高めるため、マルチモーダル大規模言語モデルと進化探索を組み合わせ、視覚フィードバックに基づく失敗パターン分析を用いて人間に理解可能なプログラム制御方策を自動生成する手法「MLES」を提案し、標準的な制御タスクにおいて PPO と同等の性能を達成しつつ、透明な制御ロジックとスケーラビリティを実現したことを示しています。

Qinglong Hu, Xialiang Tong, Mingxuan Yuan, Fei Liu, Zhichao Lu, Qingfu Zhang2026-03-11🤖 cs.LG

CTRL Your Shift: Clustered Transfer Residual Learning for Many Small Datasets

この論文は、多数の異なるソース（特にサンプル数が少ない場合）からなるデータにおける分布のシフトとサンプルサイズの変動に対処し、全体の精度とソースごとの異質性の両方を維持する予測を実現するために、クロスドメイン残差学習と適応的クラスタリングを組み合わせるメタ学習手法「CTRL」を提案し、スイスの難民雇用予測など実世界データを用いた評価で既存手法を上回る性能を実証しています。

Gauri Jain, Dominik Rothenhäusler, Kirk Bansak, Elisabeth Paulson2026-03-11🤖 cs.LG

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

この論文は、テキスト形式のシラバスが学生に十分に理解されないという課題に対し、AI 生成音楽と仮想アバターを用いてシラバスを歌って提示する新しい手法を提案し、学生の関心と情報定着率を向上させたことを報告しています。

Xinxing Wu2026-03-11🤖 cs.AI

MuFlex: A Scalable, Physics-based Platform for Multi-Building Flexibility Analysis and Coordination

本論文は、複数の建物の物理的詳細を忠実に再現し、強化学習エージェントの公平なベンチマークを可能にするスケーラブルなオープンソースプラットフォーム「MuFlex」を開発し、その有効性と拡張性を示したものである。

Ziyan Wu, Ivan Korolija, Rui Tang2026-03-11⚡ eess

RF-Informed Graph Neural Networks for Accurate and Data-Efficient Circuit Performance Prediction

この論文は、RFIC ドメイン知識を活用した特徴量インデックスとトランジスタレベルのグラフ抽象化を組み合わせた軽量なグラフニューラルネットワークを提案し、既存手法に比べて大幅に高い精度とデータ効率で多様な能動 RF 回路の性能を予測可能にするものです。

Anahita Asadi, Leonid Popryho, Inna Partin-Vaisband2026-03-11🤖 cs.LG

Iterative In-Context Learning to Enhance LLMs Abstract Reasoning: The Case-Study of Algebraic Tasks

本論文は、非標準的な代数タスクにおける LLM の推論能力を向上させるため、テストデータ分布に合致する複雑な例よりも単純な例を反復的に選択・最適化する「反復的インコンテキスト学習」手法を提案し、その有効性を示したものです。

Stefano Fioravanti, Matteo Zavatteri, Roberto Confalonieri, Kamyar Zeinalipour, Paolo Frazzetto, Alessandro Sperduti, Nicolò Navarin2026-03-11🤖 cs.LG

A Surrogate model for High Temperature Superconducting Magnets to Predict Current Distribution with Neural Network

本論文では、有限要素法（FEM）の計算コストを回避し、大規模高温超電導磁石の設計を効率化するため、T-A 定式化による FEM シミュレーションデータで学習した完全結合残差ニューラルネットワーク（FCRN）を用いた、電流密度分布の高精度予測サロゲートモデルを開発し、その最適設計への有効性を示しました。

Mianjun Xiao, Peng Song, Yulong Liu, Cedric Korte, Ziyang Xu, Jiale Gao, Jiaqi Lu, Haoyang Nie, Qiantong Deng, Timing Qu2026-03-11🤖 cs.LG

Repulsive Monte Carlo on the sphere for the sliced Wasserstein distance

本論文は、スライスト・ワルシュタイン距離の計算における積分問題に対し、決定性点過程や反発点過程に基づく quadrature 法を調査・ベンチマークし、低次元では乱択準モンテカルロ法、高次元では UnifOrtho 推定量の使用を推奨する研究結果を提示しています。

Vladimir Petrovic, Rémi Bardenet, Agnès Desolneux2026-03-11🤖 cs.LG

Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale

本論文は、大規模な汎用ロボットポリシーの研究を支援するために、シミュレーションと実世界のロボットを統一的に扱うモジュラーかつ軽量なエコシステム「Robot Control Stack (RCS)」を提案し、その設計原則と VLA や RL ポリシー開発における有用性を評価したものである。

Tobias Jülg, Pierre Krack, Seongjin Bien, Yannik Blei, Khaled Gamal, Ken Nakahara, Johannes Hechtl, Roberto Calandra, Wolfram Burgard, Florian Walter2026-03-11🤖 cs.LG

Kuramoto Orientation Diffusion Models

生物学的な同期現象に着想を得たクルモントモデルを拡散過程に応用し、指紋やテクスチャなどの方向性豊かな画像生成において、位相の同期と非同期を制御することで従来の等方性拡散モデルを超える性能を実現する新しい生成モデルを提案する。

Yue Song, T. Anderson Keller, Sevan Brodjian, Takeru Miyato, Yisong Yue, Pietro Perona, Max Welling2026-03-11🤖 cs.LG

Reinforced Generation of Combinatorial Structures: Hardness of Approximation

この論文は、大規模言語モデルによるコード変異エージェント「AlphaEvolve」を活用して、MAX-CUT やメトリック TSP などの組合せ最適化問題における近似不可能性の新たな下限を導出するガジェット構成を発見し、検証プロセス自体も AI によって高速化することで、複雑性理論の進展に AI が貢献できることを示した研究です。

Ansh Nagda, Prabhakar Raghavan, Abhradeep Thakurta2026-03-11🤖 cs.AI

VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment

本論文は、ConceptNet や WordNet などの外部知識グラフを統合し、災害後の衛星および UAV 画像の記述において、既存の汎用視覚言語モデルが抱える専門用語の欠如や事実誤認を解消し、より具体的かつ正確なキャプション生成を実現する「VLCE」というフレームワークを提案し、xBD や RescueNet などのベンチマークで高い性能を示したことを報告するものである。

Md. Mahfuzur Rahman, Kishor Datta Gupta, Marufa Kamal + 5 more2026-03-11🤖 cs.LG

ZeroSiam: An Efficient Asymmetry for Test-Time Entropy Optimization without Collapse

本論文は、テスト時エントロピー最小化におけるモデルの崩壊を防ぎ、バイアスのある学習信号を正則化して性能を向上させるための、効率的な非対称シエスミアンアーキテクチャ「ZeroSiam」を提案し、視覚適応から大規模言語モデルの推論まで多様なタスクでその有効性を示しています。

Guohao Chen, Shuaicheng Niu, Deyu Chen, Jiahao Yang, Zitian Zhang, Mingkui Tan, Pengcheng Wu, Zhiqi Shen2026-03-11🤖 cs.LG

Compose Your Policies! Improving Diffusion-based or Flow-based Robot Policies via Test-time Distribution-level Composition

この論文は、追加の学習なしに複数の事前学習済みロボット方策の分布スコアを凸結合してテスト時に合成する「General Policy Composition (GPC)」を提案し、理論的根拠と実証実験を通じて、個々の方策単体よりも優れた制御性能と適応性の向上を実現することを示しています。

Jiahang Cao, Yize Huang, Hanzhong Guo, Rui Zhang, Mu Nan, Weijian Mai, Jiaxu Wang, Hao Cheng, Jingkai Sun, Gang Han, Wen Zhao, Qiang Zhang, Yijie Guo, Qihao Zheng, Chunfeng Song, Xiao Li, Ping Luo, Andrew F. Luo2026-03-11🤖 cs.LG

Improved Robustness of Deep Reinforcement Learning for Control of Time-Varying Systems by Bounded Extremum Seeking

この論文は、時間変動する非線形システムの制御において、大量のデータから迅速な制御を学習する深層強化学習（DRL）と、モデル非依存かつロバストな有界極値探索（ES）を組み合わせることで、両者の長所を統合し、時間変動に対する耐性を大幅に向上させたハイブリッド制御手法を提案し、ロスアラモス国立研究所の線形加速器における低エネルギービーム輸送セクションの自動調整への適用事例を通じてその有効性を検証したものである。

Shaifalee Saxena, Alan Williams, Rafael Fierro, Alexander Scheinker2026-03-11🤖 cs.LG

← 前へ次へ →