cs.LG 件の論文 | Gist.Science

Continual uncertainty learning

この論文は、複数の不確実性を段階的に学習するカリキュラム学習フレームワークとモデルベース制御を組み合わせた新たな手法を提案し、自動車パワートレインの能動振動制御における非線形動特性や変動に対する頑健な制御とシミュレーションから実機への転移を実現したことを示しています。

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

本論文は、拡散言語モデルが抱える「因数分解の壁」を、Transformer の出力分布を完全な因数分解から軽量な確率的推論層へ置き換える「結合離散拡散（CoDD）」というハイブリッド枠組みによって打破し、低コストかつ低遅延で高品質な並列生成を実現することを提案しています。

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models

本論文は、高密度なスマートフォンの GPS 軌跡データから速度情報のみを入力として交通手段を推定する新しいトランスフォーマーモデル「SpeedTransformer」を提案し、従来の LSTM などのモデルを上回る精度と地域間での高い転移学習能力を実証したものである。

Yuandong Zhang, Othmane Echchabi, Tianshu Feng, Wenyi Zhang, Hsuai-Kai Liao, Charles Chang2026-03-11🤖 cs.LG

Non-Rectangular Average-Reward Robust MDPs: Optimal Policies and Their Transient Values

本論文は、非長方形の平均報酬ロバスト MDP において、定常的な敵対者に対する最適方策の存在と最小最大表現を確立し、平均報酬最適性だけでは見逃され得る過渡的性能の劣化を指摘した上で、その性能を一定オーダーに制御するエポックベースの方策を構築する。

Shengbo Wang, Nian Si2026-03-11🤖 cs.LG

DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking

本論文は、マスクド拡散モデル（MDM）が従来の ELBO ではなくテスト時分布に基づいた「正確な尤度」を計算可能にする新たな枠組み「DUEL」を提案し、これにより MDM の性能が従来考えられていたよりも大幅に高く、自己回帰モデルを超える可能性を秘めていることを実証しています。

Gilad Turok, Chris De Sa, Volodymyr Kuleshov2026-03-11🤖 cs.LG

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

本論文は、LLM の推論能力の向上に伴い、従来の木探索よりも効率的な勾配ベースの最適化パラダイムを採用した MLE エージェント「Gome」を提案し、MLE-Bench で最先端の性能を達成するとともに、モデルの推論能力が高まるにつれて勾配ベースのアプローチが木探索を上回ることを実証しています。

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

この論文は、企業の文書から文脈を抽出し、LLM を活用してニュースをマクロ・セクター・関連企業・対象企業の 4 段階に分類する意味ベースの多段階ペアリング手法を提案し、これにより従来のキーワードマッチングでは捉えきれなかった複雑な市場依存関係を反映した高品質な金融テキスト対時系列データセット「FinTexTS」を構築し、株価予測の精度向上を実証したものである。

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

この論文は、ハードウェア変更を伴わずにオーバーフロー感知スケーリングとマクロブロックスケーリングという 2 つのソフトウェア技術を導入することで、MXFP4 の量子化精度を大幅に向上させ、NVIDIA の NVFP4 との精度差を約 10% から 1% 未満に縮小し、MXFP4 を実用的な代替手段として再確立したことを示しています。

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Equitable Multi-Task Learning for AI-RANs

この論文は、AI 無線アクセスネットワーク（AI-RAN）における共有エッジリソース上の多様なユーザー間で公平な推論性能を長期的に保証し、効率性と公平性のトレードオフを制御できる軽量な「オンライン内オンライン公平多タスク学習（OWO-FMTL）」フレームワークを提案し、その有効性を示しています。

Panayiotis Raptis, Fatih Aslan, George Iosifidis2026-03-11🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

本論文は、新しい命令セットアーキテクチャを持つ新興ハードウェア向けに、LLM エージェントがフィードバック駆動型のワークフローを通じて低レベルカーネルを生成・最適化し、テンプレートベースのコンパイラ基線と同等かそれ以上の性能を達成できることを示す初のベンチマーク「KernelCraft」を提案するものである。

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao2026-03-11🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

本論文は、リソース制約のある組込みシステム向けに、ターゲットプラットフォームへの実装なしに混合精度量子化ニューラルネットワークの推論における精度、レイテンシ、リソース消費のトレードオフを評価・分析できる設計空間推論分析フレームワーク「ALADIN」を提案し、RISC-V ベースの AI ワークロード専用プラットフォームのサイクル正確なシミュレータを用いた検証を通じてその有効性を示したものである。

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

本論文は、GAP9、STM32N6、Sony IMX500 の 3 つの代表的なプロセッサを用いたベンチマーク評価と包括的なレビューを通じて、超低電力エッジ AI プロセッサの設計動向と、特にインセンサー処理の技術的成熟度や実用的なトレードオフを明らかにしています。

Luigi Capogrosso, Pietro Bonazzi, Michele Magno2026-03-11🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

この論文は、FPGA 上の CNN 推論において、プーリングやストライド付き畳み込み層によるデータレートの変化を考慮し、マルチピクセル処理と設計空間探索を活用してハードウェア利用率を最大化し、リソース効率を大幅に向上させる新しいアクセラレータアーキテクチャを提案するものです。

Tobias Habermann, Martin Kumm2026-03-11🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

本論文は、N-MNIST データセットを用いたアブレーション研究を通じて、スパイクニューラルネットワークにホップフィールドネットワークや階層的ゲート型再帰ネットワークなどの記憶増強メカニズムを統合することで、分類精度、計算効率、エネルギー消費、およびニューロン群の構造化（クラスタリング）を同時に向上させるバランスの取れた設計原則を確立したことを示しています。

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid Rehman2026-03-11🤖 cs.LG

Hebbian-Oscillatory Co-Learning

本論文は、双曲的疎な幾何学と発振器ベースの注意機構を統合し、位相同期によってシナプス可塑性を制御する「ヘッビアン発振共学習（HOC-L）」という新しい枠組みを提案し、その収束性と計算効率の理論的保証を示すものである。

Hasi Hays2026-03-11🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

この論文は、クラウド依存の遅延や信頼性課題を克服し、EV 充電インフラの故障を自律的に解決するために、エッジ環境に配置された AI エージェント「Auralink SDC」のアーキテクチャと実装、およびその高い解決率と低遅延性能を提示するものです。

Mohammed Cherifi2026-03-11🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

この論文は、感度に基づく剪定メカニズムを活用して量子化と剪定を組み合わせることで、リザーバーコンピューティングのハードウェア効率を大幅に向上させながら精度を維持する圧縮フレームワークを提案し、FPGA 実装における検証結果を示しています。

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco Platzner2026-03-11🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

この論文は、AI 推論におけるブロックスケーリング回路の必要性を排除し、IEEE 754 標準に比べて面積・消費電力・遅延を大幅に削減する「AetherFloat」と呼ばれる新しい浮動小数点アーキテクチャファミリーを提案し、特に 8 ビット形式（AF8）がブロックスケーリング不要な形式として機能し、16 ビット形式（AF16）が bfloat16 の代替として機能することを示しています。

Keita Morisaki2026-03-11🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

この論文は、従来の数値解法では困難であった非線形性やマルチスケールダイナミクスを持つニューロンモデルにおいて、物理情報ニューラルネットワーク（PINN）を用いて不完全かつノイズの多い電位観測データから生体物理パラメータと非観測状態変数を同時に高精度に推定する堅牢な手法を提案し、その有効性を示したものである。

Changliang Wei, Yangyang Wang, Xueyu Zhu2026-03-11🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

本論文は、多変量時系列の交換性を保証する理論的枠組みに基づき、変数間の順序依存性を排除し、局所ダイナミクスとグローバルな相互作用に分解することで、予測・分類・異常検出において最先端の性能と構造的なスケーラビリティを実現する「VI 2D Mamba」という新しいアーキテクチャを提案しています。

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

← 前へ次へ →