Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

本論文は、チャートの深層分析能力の向上に向けた課題として、多様な報酬信号やデータ間の競合を解消する並列相対方策最適化(PRPO)と、エラー注入に基づく客観的評価ベンチマーク(MCDR-Bench)を提案し、これらを通じてチャート深層分析のトレーニングと評価を体系的に改善する統合フレームワークを構築したことを示しています。

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

この論文は、事後サンプリングにおける推定誤差を軽減し、より高品質な生成を実現するために、追加の逆方向ノイズ除去ステップとモンテカルロサンプリングを組み合わせたプラグアンドプレイ手法「ABMS」を提案し、理論的解析と多様なタスクにおける実験を通じてその有効性を証明したものである。

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

この論文は、訓練データが存在しない条件下でも、畳み込みフィルタリングと最適化された早期停止戦略を用いた教師なし学習フレームワークにより、高エネルギー加速器のビーム診断において低信号対雑音比環境でのビームエミッタンス画像の高精度な復元とビームハローの解像度向上を実現する手法を提案しています。

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

この論文は、不変性と等変性のトレードオフを解決するため、最終埋め込みには不変性を維持しつつ中間空間トークンマップに等変性を「ソフト」に付与する新しい正則化手法「Soft Equivariance Regularization (SER)」を提案し、画像認識や物体検出などのタスクで既存の自己教師あり学習手法を大幅に改善することを示しています。

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

本論文は、RGB 入力のみを用いたマルチモーダル大規模言語モデル(MLLM)がカメラ固有のパラメータに過剰適合し汎化能力に欠けることを指摘し、カメラ内部パラメータの注入、カメラパラメータの多様化によるデータ拡張、および 3D 視覚基盤モデルからの幾何学的知識の蒸留を行う「カメラ認識型 MLLM」を提案することで、空間推論タスクにおけるカメラ間での汎化性能を大幅に向上させることを示しています。

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

本論文は、大規模なツール環境において小規模言語モデル(SLM)がコンテキストの制御と実行構造を学習し、ルブリックに基づく強化学微細調整を通じて、パラメータやコンテキスト制約が厳しい条件下でも最先端のエージェントに匹敵する性能を発揮できるようにする「ATLAS」というフレームワークを提案するものである。

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

プライバシー規制により制限される電子カルテの共有を可能にするため、MIMIC-IV データベースを用いて高忠実度の生成モデルと大規模言語モデルによる自動監査を組み合わせたパイプラインを開発し、統計的忠実度だけでなく臨床的一貫性も保証された合成患者トラジェクトリを生成し、その結果、下流タスクでの性能向上とプライバシーリスクの不在を実証しました。

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

本論文は、タンパク質の配列と構造の情報を対照学習を用いて統合し、両者の埋め込み空間を一致させることで、クロスモーダル検索や機能予測などの下流タスクの性能向上とタンパク質の理解・設計への新たな洞察を提供する「ProtAlign」というフレームワークを提案しています。

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

本論文は、時系列基盤モデルが捉えた過去のパターンを予測特徴量として回帰モデルに注入する「FutureBoosting」という新しいハイブリッド AI 手法を提案し、電力価格予測の精度を大幅に向上させることを実証しています。

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

この論文は、事前学習済み言語モデルの層間に明示的な「安全ビット」を挿入するモジュール型アプローチ「Safe Transformer」を提案し、安全性判断の解釈性と手動制御を両立させながら、軽量な微調整のみで高い攻撃耐性を実現することを示しています。

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

この論文は、Apple の Neural Engine に対する非公式 API を活用し、コンパイル時の重み更新を回避する最適化技術を実装することで、大規模言語モデルのトレーニングと推論を可能にした初のオープンエンドツーエンドシステム「Orion」を提案し、M4 Max 上で安定したトレーニングと高速な推論を実現したことを報告しています。

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

この論文は、密度不変な観測エンコーディングと密度ランダム化トレーニング、および物理情報に基づく報酬設計を導入した強化学習アプローチを提案し、訓練時よりも高密度な混雑環境においても「凍結」や「衝突」を回避しつつ目標地点へ到達する汎用的なナビゲーションを実現するものです。

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

本論文は、MLIR ベースのモジュール型コンパイラ基盤「PolyBlocks」の設計と実装を提案し、その自動コード生成能力が PyTorch や JAX 向けに NVIDIA GPU で Torch Inductor や XLA と同等、あるいはそれ以上の性能を発揮し、個別演算においてもベンダー最適化ライブラリや手書きカーネルと競合する結果を示したものである。

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

この論文は、ベイズ的不確実性の把握、公平性制約付き勾配ブースティング、シフト認識型融合戦略を統合した「Calibrated Credit Intelligence(CCI)」フレームワークを提案し、Home Credit のベンチマークにおいて、時間的分布のシフト下でも高い識別力、較正精度、公平性を同時に達成するcredit スコアリング手法を示しています。

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

この論文は、位置バイアスを低ランクの暗黙的ニューラル表現で近似する「ランク分解型暗黙的ニューラルバイアス(RIB)」を提案し、FlashAttention の利用を可能にすることで超解像トランスフォーマーの計算効率とスケーラビリティを飛躍的に向上させ、Urban100×2 で 35.63 dB の PSNR を達成しながらトレーニングおよび推論時間を大幅に短縮することを示しています。

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

この論文は、物理法則や安全制約などの複雑な領域内で現実的なサンプルを生成するために、事前学習済み生成モデルを微調整して制約条件を遵守させる新しいフレームワークを提案し、既存手法とは異なる制約満足度とサンプリング品質の新たなトレードオフを示すものである。

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

この論文は、拡散言語モデルへの GRPO の直接適用で発生する報酬崩壊を、確率比推定に伴うノイズによる不安定性を解消する「StableDRL」という新しい手法と階段型アテンション機構によって解決し、拡散モデルの安定した強化学習を可能にすることを提案しています。

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG