Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

本論文は、大規模なツール環境において小規模言語モデル(SLM)がコンテキストの制御と実行構造を学習し、ルブリックに基づく強化学微細調整を通じて、パラメータやコンテキスト制約が厳しい条件下でも最先端のエージェントに匹敵する性能を発揮できるようにする「ATLAS」というフレームワークを提案するものである。

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

プライバシー規制により制限される電子カルテの共有を可能にするため、MIMIC-IV データベースを用いて高忠実度の生成モデルと大規模言語モデルによる自動監査を組み合わせたパイプラインを開発し、統計的忠実度だけでなく臨床的一貫性も保証された合成患者トラジェクトリを生成し、その結果、下流タスクでの性能向上とプライバシーリスクの不在を実証しました。

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

本論文は、タンパク質の配列と構造の情報を対照学習を用いて統合し、両者の埋め込み空間を一致させることで、クロスモーダル検索や機能予測などの下流タスクの性能向上とタンパク質の理解・設計への新たな洞察を提供する「ProtAlign」というフレームワークを提案しています。

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

本論文は、時系列基盤モデルが捉えた過去のパターンを予測特徴量として回帰モデルに注入する「FutureBoosting」という新しいハイブリッド AI 手法を提案し、電力価格予測の精度を大幅に向上させることを実証しています。

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

この論文は、事前学習済み言語モデルの層間に明示的な「安全ビット」を挿入するモジュール型アプローチ「Safe Transformer」を提案し、安全性判断の解釈性と手動制御を両立させながら、軽量な微調整のみで高い攻撃耐性を実現することを示しています。

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

この論文は、Apple の Neural Engine に対する非公式 API を活用し、コンパイル時の重み更新を回避する最適化技術を実装することで、大規模言語モデルのトレーニングと推論を可能にした初のオープンエンドツーエンドシステム「Orion」を提案し、M4 Max 上で安定したトレーニングと高速な推論を実現したことを報告しています。

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

この論文は、密度不変な観測エンコーディングと密度ランダム化トレーニング、および物理情報に基づく報酬設計を導入した強化学習アプローチを提案し、訓練時よりも高密度な混雑環境においても「凍結」や「衝突」を回避しつつ目標地点へ到達する汎用的なナビゲーションを実現するものです。

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

本論文は、MLIR ベースのモジュール型コンパイラ基盤「PolyBlocks」の設計と実装を提案し、その自動コード生成能力が PyTorch や JAX 向けに NVIDIA GPU で Torch Inductor や XLA と同等、あるいはそれ以上の性能を発揮し、個別演算においてもベンダー最適化ライブラリや手書きカーネルと競合する結果を示したものである。

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

この論文は、ベイズ的不確実性の把握、公平性制約付き勾配ブースティング、シフト認識型融合戦略を統合した「Calibrated Credit Intelligence(CCI)」フレームワークを提案し、Home Credit のベンチマークにおいて、時間的分布のシフト下でも高い識別力、較正精度、公平性を同時に達成するcredit スコアリング手法を示しています。

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

この論文は、位置バイアスを低ランクの暗黙的ニューラル表現で近似する「ランク分解型暗黙的ニューラルバイアス(RIB)」を提案し、FlashAttention の利用を可能にすることで超解像トランスフォーマーの計算効率とスケーラビリティを飛躍的に向上させ、Urban100×2 で 35.63 dB の PSNR を達成しながらトレーニングおよび推論時間を大幅に短縮することを示しています。

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

この論文は、物理法則や安全制約などの複雑な領域内で現実的なサンプルを生成するために、事前学習済み生成モデルを微調整して制約条件を遵守させる新しいフレームワークを提案し、既存手法とは異なる制約満足度とサンプリング品質の新たなトレードオフを示すものである。

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

この論文は、拡散言語モデルへの GRPO の直接適用で発生する報酬崩壊を、確率比推定に伴うノイズによる不安定性を解消する「StableDRL」という新しい手法と階段型アテンション機構によって解決し、拡散モデルの安定した強化学習を可能にすることを提案しています。

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

Implementation of Quantum Implicit Neural Representation in Deterministic and Probabilistic Autoencoders for Image Reconstruction/Generation Tasks

この論文は、古典的 CNN エンコーダと量子インプリシットニューラル表現(QINR)デコーダを組み合わせたハイブリッドモデルを提案し、MNIST などのデータセットを用いた画像再構成・生成タスクにおいて、従来の量子生成モデルよりも多様性と画質の両面で優れた性能を示すことを実証しています。

Saadet Müzehher Eren2026-03-10⚛️ quant-ph

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

この論文は、不均衡なデータにおける概念ドリフト検出時に生じる「マスキング効果」を回避し、小規模な概念のドリフトを解釈可能かつロバストに検出するための、偏りのないクラスター記述子に基づく新しい手法「ICD3」を提案するものである。

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG