cs.LG 件の論文 | Gist.Science

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

この論文は、実録音からのピッチ適応スペクトル分析とパラメトリック合成を組み合わせた分析駆動型フレームワークを提案し、サンプル単位のRPMおよびトルク注釈を備えた大規模なエンジン音合成データセット「Procedural Engine Sounds Dataset」を構築・公開し、自動車音響設計やデータ駆動型合成研究を支援することを目的としています。

Robin Doerfler, Lonce Wyse2026-03-10🤖 cs.LG

Models as Lego Builders: Assembling Malice from Benign Blocks via Semantic Blueprints

この論文は、大規模視覚言語モデル（LVLM）が個別には安全に見える視覚的スロットを構造的に組み合わせて有害な出力を生成する新たな脆弱性を発見し、これを悪用した単一クエリによる「StructAttack」という新しい脱獄フレームワークを提案したものである。

Chenxi Li, Xianggan Liu, Dake Shen, Yaosong Du, Zhibo Yao, Hao Jiang, Linyi Jiang, Chengwei Cao, Jingzhe Zhang, RanYi Peng, Peiling Bai, Xiande Huang2026-03-10🤖 cs.LG

Shorter Thoughts, Same Answers: Difficulty-Scaled Segment-Wise RL for CoT Compression

この論文は、推論コストを削減しつつ回答の品質を維持するため、問題の難易度に応じて推論部分と回答部分を分離し、それぞれに適切な強化学習信号を適用する「Difficulty-Scaled Segment-Wise GRPO（DSS-GRPO）」を提案しています。

Ye Tian, Aijun Liu2026-03-10🤖 cs.LG

MetaSort: An Accelerated Approach for Non-uniform Compression and Few-shot Classification of Neural Spike Waveforms

本論文は、メタ転移学習を活用して神経スパイク波形の非一様圧縮と少数ショット分類を同時に処理し、生体実験で高い性能を示した「MetaSort」と呼ばれる新規アルゴリズムを提案しています。

Luca M. Meyer, Majid Zamani2026-03-10🤖 cs.LG

TT-Sparse: Learning Sparse Rule Models with Differentiable Truth Tables

この論文は、微分可能な真理値表と新しい soft TopK 演算子を用いて、高い予測性能と低い複雑さを両立し、かつ DNF/CNF ブール論理式として完全に解釈可能なスパースなルールモデル「TT-Sparse」を提案し、28 のデータセットで既存の最先端手法を上回る性能を実証しています。

Hans Farrell Soegeng, Sarthak Ketanbhai Modi, Thomas Peyrin2026-03-10🤖 cs.LG

MAS-H2: A Hierarchical Multi-Agent System for Holistic Cloud-Native Autoscaling

本論文は、Kubernetes 環境におけるビジネスポリシーとリソースプロビジョニングの乖離による課題を解決するため、戦略・計画・実行の 3 層構造を持つ階層型マルチエージェントシステム「MAS-H2」を提案し、その実証実験において従来の自動スケーリング手法と比較してリソース効率の大幅な向上とゼロダウンタイム移行を実現したことを報告しています。

Hamed Hamzeh, Parisa Vahdatian2026-03-10🤖 cs.LG

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

この論文は、凍結された視覚生成モデルに低ランク適応を付加して信号を関数として符号化する新たな枠組みを提案し、これにより極低ビットレートでの高品質な動画圧縮を実現するとともに、圧縮と生成を統合する新たなアプローチを示しています。

Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, José Miguel Hernández-Lobato, Yan Lu2026-03-10🤖 cs.LG

SMAT: Staged Multi-Agent Training for Co-Adaptive Exoskeleton Control

本論文は、人間の運動適応の段階的な性質を反映した「段階的マルチエージェント訓練（SMAT）」を提案し、シミュレーションおよび実機実験を通じて、ユーザーごとの再訓練なしに一貫した支援と正味の機械的パワーを実現するコ適応型外骨格制御の成功を示しています。

Yifei Yuan, Ghaith Androwis, Xianlian Zhou2026-03-10🤖 cs.LG

Accelerating Diffusion Models for Generative AI Applications with Silicon Photonics

この論文は、拡散モデルの推論における高いエネルギー消費と計算負荷という課題に対し、シリコンフォトニクス技術を用いた新しいアクセラレータを提案し、最先端の加速器と比較して少なくとも 3 倍のエネルギー効率と 5.5 倍のスループット向上を実現したことを報告しています。

Tharini Suresh, Salma Afifi, Sudeep Pasricha2026-03-10🤖 cs.LG

Exoskeleton Control through Learning to Reduce Biological Joint Moments in Simulations

この論文は、強化学習を用いて生物学的関節モーメントを低減する外骨格制御ポリシーを学習し、オープンソースの歩行データセットを用いた検証パイプラインによって、シミュレーションで訓練された制御ネットワークが生物学的関節モーメントと高い一致を示すことを実証するとともに、シミュレーションから実世界への転移における可能性と課題を明らかにしたものである。

Zihang You, Xianlian Zhou2026-03-10🤖 cs.LG

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

本論文は、大規模言語モデルの推論能力を活用し、文脈学習による多様な候補解の探索と強化学習による反復的な方策改善を統合した階層的進化強化学習フレームワーク「HELIX」を提案し、円のパッキング問題や機械学習ベンチマークにおいて最先端の成果を達成したことを報告するものである。

Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

この論文は、NVIDIA Omniverse を活用したアルジェ国際空港のデジタルツインに基づく合成データ生成パイプラインを提案し、限られた実データのアノテーションを合成データと組み合わせることで、手作業を 25〜35% 削減しつつも、高密度で重なり合う手荷物カートの検出において実データのみを使用する場合と同等以上の精度を達成できることを実証しています。

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

Compressed Proximal Federated Learning for Non-Convex Composite Optimization on Heterogeneous Data

非凸複合最適化問題における統計的異質性とバイアス付き圧縮の課題に対処するため、非滑正則項を局所的に処理しつつ通信効率を最大化する新規アルゴリズム「FedCEF」を提案し、理論的な収束保証と極端な圧縮率下での高い精度を実証した。

Pu Qiu, Chen Ouyang, Yongyang Xiong, Keyou You, Wanquan Liu, Yang Shi2026-03-10🤖 cs.LG

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

この論文は、偏微分方程式の数値解法における古典的手法と機械学習アプローチを、それぞれの認識論的基盤（演繹的誤差保証対統計的近似）に基づき批判的に比較検討し、両者の相補性を活かしたハイブリッド手法の設計原則や将来の技術的展望を体系的に論じています。

Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad2026-03-10🤖 cs.LG

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

この論文は、オフライン指標の改善がオンライン性能に直結しない「指標の不一致」という課題を解決するため、ベイズ最適集合と後悔転移を用いて異なる評価指標間の定量的な関係を統一的に理論化し、オフラインとオンラインの目標を整合させる評価システムの設計を可能にする枠組みを提案しています。

Yuanhao Pu, Defu Lian, Enhong Chen2026-03-10🤖 cs.LG

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

本論文は、アプリケーションやシステムデータを活用した機械学習駆動およびデータ認識型のマイクロアーキテクチャ手法（強化学習に基づくデータプリフェッチや意味的特性の活用など）を提案し、従来のデータ非依存な設計の限界を克服することで、メモリボトルネックを緩和しパフォーマンスとエネルギー効率を大幅に向上させることを示しています。

Rahul Bera2026-03-10🤖 cs.LG

Scalable Training of Mixture-of-Experts Models with Megatron Core

本論文は、メモリー、通信、計算の各側面を横断する統合最適化と並列化手法を導入し、数千の GPU クラスターで数十億から数兆パラメータ規模の混合専門家（MoE）モデルの効率的なトレーニングを可能にする、生産環境対応のオープンソースフレームワーク「Megatron Core」の技術とシステム設計を詳述しています。

Zijie Yan (NVIDIA), Hongxiao Bai (NVIDIA), Xin Yao (NVIDIA), Dennis Liu (NVIDIA), Tong Liu (NVIDIA), Hongbin Liu (NVIDIA), Pingtian Li (NVIDIA), Evan Wu (NVIDIA), Shiqing Fan (NVIDIA), Li Tao (NVIDIA), Robin Zhang (NVIDIA), Yuzhong Wang (NVIDIA), Shifang Xu (NVIDIA), Jack Chang (NVIDIA), Xuwen Chen (NVIDIA), Kunlun Li (NVIDIA), Yan Bai (NVIDIA), Gao Deng (NVIDIA), Nan Zheng (NVIDIA), Vijay Anand Korthikanti (NVIDIA), Abhinav Khattar (NVIDIA), Ethan He (NVIDIA), Soham Govande (NVIDIA), Sangkug Lym (NVIDIA), Zhongbo Zhu (NVIDIA), Qi Zhang (NVIDIA), Haochen Yuan (NVIDIA), Xiaowei Ren (NVIDIA), Deyu Fu (NVIDIA), Tailai Ma (NVIDIA), Shunkang Zhang (NVIDIA), Jiang Shao (NVIDIA), Ray Wang (NVIDIA), Santosh Bhavani (NVIDIA), Xipeng Li (NVIDIA), Chandler Zhou (NVIDIA), David Wu (NVIDIA), Yingcan Wei (NVIDIA), Ashwath Aithal (NVIDIA), Michael Andersch (NVIDIA), Mohammad Shoeybi (NVIDIA), Jiajie Yao (NVIDIA), June Yang (NVIDIA)2026-03-10🤖 cs.LG

← 前へ次へ →

cs.LG