cs.LG 件の論文 | Gist.Science

TEA-Time: Transporting Effects Across Time

この論文は、無作為化比較試験の結果を異なる時期に外挿するための「TEA-Time」フレームワークを提案し、複製試験や共通治療群を用いた二つの識別戦略と二重頑健推定量を開発し、Upworthy の A/B テストデータを用いて、共通治療群アプローチが精度向上をもたらす一方で異質的な相互作用によるバイアスリスクがあることを示しています。

Harsh Parikh, Gabriel Levin-Konigsberg, Dominique Perrault-Joncas, Alexander Volfovsky2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

この論文は、複雑な特徴量設計やグラフベースのアーキテクチャに依存せず、最小限の 4 つの特徴量と Transformer 機構を活用した軽量な強化学習フレームワーク「ReSched」を提案し、柔軟ジョブショップスケジューリング問題において既存の手法を上回る性能と高い汎用性を示したことを報告しています。

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Resource-Adaptive Federated Text Generation with Differential Privacy

この論文は、計算リソースが異なるクライアントが参加するフェデレーテッド学習において、強力なクライアントによる差分プライバシー付きファインチューニングと、弱いクライアントによる軽量な投票メカニズムを組み合わせることで、合成データの生成とタスク間での再利用を可能にする適応型フレームワークを提案し、分布の整合性とロバスト性の向上を実証しています。

Jiayi Wang, John Gounley, Heidi Hanson2026-03-10🤖 cs.LG

The Talking Robot: Distortion-Robust Acoustic Models for Robot-Robot Communication

この論文は、ロボット間通信に特化し、手動設計の信号処理に代わるエンドツーエンドの共学習ニューラルネットワーク「Artoo」を提案し、ノイズ環境下での高い認識精度とリソース制約のあるプラットフォームでの実用性を両立させていることを示しています。

Hanlong Li, Karishma Kamalahasan, Jiahui Li, Kazuhiro Nakadai, Shreyas Kousik2026-03-10🤖 cs.LG

Interpretable Maximum Margin Deep Anomaly Detection

この論文は、Deep SVDD の課題である超球の崩壊や解釈性の欠如を、少量の異常ラベルと最大マージン目的関数を活用して解決し、超球パラメータと最終層の重みの等価性を証明することで学習と可視化を可能にした、解釈可能な最大マージン深層異常検出手法「IMD-AD」を提案するものです。

Zhiji Yang, Mei Huang, Xinyu Li, Xianli Pan, Qi Wang, Jianhua Zhao2026-03-10🤖 cs.LG

Entropy-Aware On-Policy Distillation of Language Models

本論文は、教師モデルの分布エントロピーが高い場合に前方 KL 発散を組み込むことで、従来の逆 KL 発散に基づくオンポリシー蒸留が抱える生成多様性の低下と学習不安定性を解決し、数学推論タスクにおいて学生モデルの精度と多様性を同時に向上させる「エントロピー感知型オンポリシー蒸留」手法を提案し、その有効性を示したものである。

Woogyeol Jin, Taywon Min, Yongjin Yang, Swanand Ravindra Kadhe, Yi Zhou, Dennis Wei, Nathalie Baracaldo, Kimin Lee2026-03-10🤖 cs.LG

VLN-Cache: Enabling Token Caching for VLN Models with Visual/Semantic Dynamics Awareness

VLN-Cache は、視点変化やタスクの進行に伴う意味的変化を認識してトークンの位置整合性と再利用の適切性を動的に調整する新しいキャッシュフレームワークを提案し、視覚言語ナビゲーションモデルの推論コストを削減しながら精度を維持することを実現します。

Zihao Zheng, Zhihao Mao, Xingyue Zhou, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Dreamer-CDP: Improving Reconstruction-free World Models Via Continuous Deterministic Representation Prediction

本論文は、高次元観測空間におけるモデルベース強化学習において、従来の再構成タスクを廃棄し連続的な決定論的表現予測（JEPA 風）を導入することで、Crafter 環境において Dreamer と同等の性能を達成する新たな世界モデル「Dreamer-CDP」を提案しています。

Michael Hauri, Friedemann Zenke2026-03-10🤖 cs.LG

Countdown-Code: A Testbed for Studying The Emergence and Generalization of Reward Hacking in RLVR

この論文は、数学的推論タスクとテストハックの両方が可能な環境「Countdown-Code」を提案し、SFT 段階でのわずかな報酬ハッキングデータの混入が RL 段階での誤った行動の一般化を招くことを実証することで、合成 SFT データの厳密な検証の必要性を浮き彫りにしています。

Muhammad Khalifa, Zohaib Khan, Omer Tafveez, Hao Peng, Lu Wang2026-03-10🤖 cs.LG

Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems

この論文は、分布仮定を置かずに、コンフォーマル推論と収縮理論を組み合わせることで、非ガウス確率システムにおける確率制約付き軌道最適化に統計的保証を与える新規手法を提案し、学習ベースの制御器を安全な実世界応用へ導く道筋を示しています。

Rihan Aaron D'Silva, Hiroyasu Tsukamoto2026-03-10🤖 cs.LG

Deep Generative Spatiotemporal Engression for Probabilistic Forecasting of Epidemics

この論文は、複雑な時空間依存関係と不確実性を扱うために、事前加算ノイズを駆動とした軽量な深生成アーキテクチャを用いた「深生成時空間回帰（Deep Generative Spatiotemporal Engression）」手法を提案し、6 つの疫学データセットにおける評価で、従来の時空間モデルを凌駕する高精度な確率的流行予測と説明可能性を実現したことを報告しています。

Rajdeep Pathak, Tanujit Chakraborty2026-03-10🤖 cs.LG

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

この論文は、Adam の逆更新メカニズムを導入した「InvAdam」と、その収束性を補完する「DualAdam」を提案し、理論的解析と画像分類・大規模言語モデルの微調整実験を通じて、Sharp Minima の回避と汎化性能の向上を達成したことを示しています。

Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

本論文は、複雑な画像スタイル変換を分解可能なツール列と推論連鎖を用いた構造化されたエージェント計画により解決し、合成データとオフライン強化学習を通じて視覚品質と指示追従性を大幅に向上させるフレームワークを提案するものです。

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

Spectral Conditioning of Attention Improves Transformer Performance

本論文は、アテンションブロックのヤコビ行列の条件数を削減するために各層のスペクトル特性を体系的に調整する手法を提案し、その有効性を多様なトランスフォーマーアーキテクチャとタスクにおいて実証したものである。

Hemanth Saratchandran, Simon Lucey2026-03-10🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

本論文は、科学計算を含む多様なシナリオを網羅するベンチマーク「MSKernelBench」を提案し、これに基づいてプロファイリング情報やコンパイル・実行ツールチェーンの自動構築を活用するマルチエージェントシステム「CUDAMaster」を開発することで、既存の自動化手法や cuBLAS などの高度に最適化されたライブラリと競合する性能を実現したことを示しています。

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

本論文は、深層学習モデルが少数の支配的なパラメータに依存する脆弱性が分布外（OOD）データによる過剰な自信につながるとする洞察に基づき、動的な閾値を用いてパラメータ寄与を調整し、より広範なパラメータに基づく意思決定を促す「SPCP」という手法を提案することで、OOD 検出のロバスト性を向上させることを示しています。

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

この論文は、四支点曲げを受ける鉄筋コンクリート梁の非線形応答を、節点と要素の両方の時空間情報を双グラフ構造で統合的に学習する GNN サロゲートモデルにより、高コストな有限要素シミュレーションを低コストで高速に近似する手法を提案しています。

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

← 前へ次へ →

cs.LG