The Affine Divergence: Aligning Activation Updates Beyond Normalisation

この論文は、勾配降下におけるアクティベーション更新の非理想的なスケーリングを補正する新たな理論的枠組みを提案し、既存の正規化手法とは異なる機能を持つ「PatchNorm」などの新しい手法を開発することで、モデル性能の向上と正規化のメカニズムに関する概念の再構築を実現したことを示しています。

George Bird2026-03-11🤖 cs.LG

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

この論文は、インフルエンス関数を用いてトレーニングデータに微小な編集を加えることで、モデルの動作を意図的に誘発・制御する「Infusion」というフレームワークを提案し、画像および言語タスクにおいてその有効性とアーキテクチャ間での転移性を示しています。

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Robust Assortment Optimization from Observational Data

この論文は、顧客の選好変動やモデルの誤指定といった現実の課題に対処するため、分布のシフトを考慮した最悪ケース期待収益を最大化する頑健なアソートメント最適化の枠組みを提案し、その計算可能性と統計的効率性(特に「頑健なアイテム別カバレッジ」という新たなデータ要件の発見)を理論的に保証するものです。

Miao Lu, Yuxuan Han, Han Zhong, Zhengyuan Zhou, Jose Blanchet2026-03-11🤖 cs.LG

Bottleneck Transformer-Based Approach for Improved Automatic STOI Score Prediction

本研究は、クリーンな参照音声が必要ない非侵入型音声評価モデルとして、畳み込みブロックとマルチヘッド自己注意層を組み合わせたボトルネック・トランスフォーマーを提案し、既存の自己教師あり学習ベースのモデルを上回る精度で短時間客観的明瞭度(STOI)スコアを予測可能にしたことを示しています。

Amartyaveer, Murali Kadambi, Chandra Mohan Sharma, Anupam Mondal, Prasanta Kumar Ghosh2026-03-11🤖 cs.LG

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

この論文は、拡散モデルの推論遅延を軽減しつつ中間軌道の構造情報を保持するために、教師の軌道の各離散ステップに対応する複数のブランチを備えた学生モデルを提案し、密な軌道アライメントを通じて生成品質を向上させる「B-DENSE」と呼ばれる新しいフレームワークを紹介しています。

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

Missing-by-Design: Certifiable Modality Deletion for Revocable Multimodal Sentiment Analysis

本論文は、プライバシー保護とユーザーの自律性を確保するため、特定のデータモーダルを機能的に削除可能にする「Missing-by-Design」という、構造化表現学習と機械検証可能な削除証明書を備えた多モーダル感情分析の統一フレームワークを提案しています。

Rong Fu, Ziming Wang, Chunlei Meng, Jiaxuan Lu, Jiekai Wu, Kangan Qian, Hao Zhang, Simon Fong2026-03-11🤖 cs.LG

Breaking the Factorization Barrier in Diffusion Language Models

本論文は、拡散言語モデルが抱える「因数分解の壁」を、Transformer の出力分布を完全な因数分解から軽量な確率的推論層へ置き換える「結合離散拡散(CoDD)」というハイブリッド枠組みによって打破し、低コストかつ低遅延で高品質な並列生成を実現することを提案しています。

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Detecting Transportation Mode Using Dense Smartphone GPS Trajectories and Transformer Models

本論文は、高密度なスマートフォンの GPS 軌跡データから速度情報のみを入力として交通手段を推定する新しいトランスフォーマーモデル「SpeedTransformer」を提案し、従来の LSTM などのモデルを上回る精度と地域間での高い転移学習能力を実証したものである。

Yuandong Zhang, Othmane Echchabi, Tianshu Feng, Wenyi Zhang, Hsuai-Kai Liao, Charles Chang2026-03-11🤖 cs.LG

DUEL: Exact Likelihood for Masked Diffusion via Deterministic Unmasking

本論文は、マスクド拡散モデル(MDM)が従来の ELBO ではなくテスト時分布に基づいた「正確な尤度」を計算可能にする新たな枠組み「DUEL」を提案し、これにより MDM の性能が従来考えられていたよりも大幅に高く、自己回帰モデルを超える可能性を秘めていることを実証しています。

Gilad Turok, Chris De Sa, Volodymyr Kuleshov2026-03-11🤖 cs.LG

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

本論文は、LLM の推論能力の向上に伴い、従来の木探索よりも効率的な勾配ベースの最適化パラダイムを採用した MLE エージェント「Gome」を提案し、MLE-Bench で最先端の性能を達成するとともに、モデルの推論能力が高まるにつれて勾配ベースのアプローチが木探索を上回ることを実証しています。

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

この論文は、企業の文書から文脈を抽出し、LLM を活用してニュースをマクロ・セクター・関連企業・対象企業の 4 段階に分類する意味ベースの多段階ペアリング手法を提案し、これにより従来のキーワードマッチングでは捉えきれなかった複雑な市場依存関係を反映した高品質な金融テキスト対時系列データセット「FinTexTS」を構築し、株価予測の精度向上を実証したものである。

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

この論文は、ハードウェア変更を伴わずにオーバーフロー感知スケーリングとマクロブロックスケーリングという 2 つのソフトウェア技術を導入することで、MXFP4 の量子化精度を大幅に向上させ、NVIDIA の NVFP4 との精度差を約 10% から 1% 未満に縮小し、MXFP4 を実用的な代替手段として再確立したことを示しています。

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Equitable Multi-Task Learning for AI-RANs

この論文は、AI 無線アクセスネットワーク(AI-RAN)における共有エッジリソース上の多様なユーザー間で公平な推論性能を長期的に保証し、効率性と公平性のトレードオフを制御できる軽量な「オンライン内オンライン公平多タスク学習(OWO-FMTL)」フレームワークを提案し、その有効性を示しています。

Panayiotis Raptis, Fatih Aslan, George Iosifidis2026-03-11🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

本論文は、新しい命令セットアーキテクチャを持つ新興ハードウェア向けに、LLM エージェントがフィードバック駆動型のワークフローを通じて低レベルカーネルを生成・最適化し、テンプレートベースのコンパイラ基線と同等かそれ以上の性能を達成できることを示す初のベンチマーク「KernelCraft」を提案するものである。

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao2026-03-11🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

本論文は、リソース制約のある組込みシステム向けに、ターゲットプラットフォームへの実装なしに混合精度量子化ニューラルネットワークの推論における精度、レイテンシ、リソース消費のトレードオフを評価・分析できる設計空間推論分析フレームワーク「ALADIN」を提案し、RISC-V ベースの AI ワークロード専用プラットフォームのサイクル正確なシミュレータを用いた検証を通じてその有効性を示したものである。

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI