Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

この論文は、事前学習済み言語モデルの層間に明示的な「安全ビット」を挿入するモジュール型アプローチ「Safe Transformer」を提案し、安全性判断の解釈性と手動制御を両立させながら、軽量な微調整のみで高い攻撃耐性を実現することを示しています。

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

この論文は、密度不変な観測エンコーディングと密度ランダム化トレーニング、および物理情報に基づく報酬設計を導入した強化学習アプローチを提案し、訓練時よりも高密度な混雑環境においても「凍結」や「衝突」を回避しつつ目標地点へ到達する汎用的なナビゲーションを実現するものです。

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

この論文は、ベイズ的不確実性の把握、公平性制約付き勾配ブースティング、シフト認識型融合戦略を統合した「Calibrated Credit Intelligence(CCI)」フレームワークを提案し、Home Credit のベンチマークにおいて、時間的分布のシフト下でも高い識別力、較正精度、公平性を同時に達成するcredit スコアリング手法を示しています。

Srikumar Nayak2026-03-10🤖 cs.LG

Agent Hunt: Bounty Based Collaborative Autoformalization With LLM Agents

この論文は、複数の LLM ベースのコーディングエージェントが、証明タスクに対して動的に提案や報酬(バウンティ)を設定し、証明アシスタントと直接対話しながら分散的に協力して代数トポロジーの大規模な自動形式化を実現する、市場原理に基づく新しいアプローチを提案するものである。

Chad E. Brown, Cezary Kaliszyk, Josef Urban2026-03-10💻 cs

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

この論文は、位置バイアスを低ランクの暗黙的ニューラル表現で近似する「ランク分解型暗黙的ニューラルバイアス(RIB)」を提案し、FlashAttention の利用を可能にすることで超解像トランスフォーマーの計算効率とスケーラビリティを飛躍的に向上させ、Urban100×2 で 35.63 dB の PSNR を達成しながらトレーニングおよび推論時間を大幅に短縮することを示しています。

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution

本研究は、研究用コードの実行に必要な複雑な環境構築を評価する新たなベンチマーク「ResearchEnvBench」を提案し、現状の最先端エージェントが依存関係の解決やバージョン管理において大きな課題を抱えていることを明らかにしました。

Yubang Wang, Chenxi Zhang, Bowen Chen, Zezheng Huai, Zihao Dai, Xinchi Chen, Yuxin Wang, Yining Zheng, Jingjing Gong, Xipeng Qiu2026-03-10💻 cs

ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins

本論文は、ウイルスタンパク質における変異効果の予測やワクチン候補の選定を支援するため、79 の深層変異スキャンアッセイと実世界のタスクを含む大規模なベンチマーク「ViroGym」を構築し、実験データを用いて選定されたタンパク質言語モデルが実世界の優勢な変異を予測する上で優れていることを示した。

Yichen Zhou, Jonathan Golob, Amir Karimi, Stefan Bauer, Patrick Schwab2026-03-10💻 cs

Improved Constrained Generation by Bridging Pretrained Generative Models

この論文は、物理法則や安全制約などの複雑な領域内で現実的なサンプルを生成するために、事前学習済み生成モデルを微調整して制約条件を遵守させる新しいフレームワークを提案し、既存手法とは異なる制約満足度とサンプリング品質の新たなトレードオフを示すものである。

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

この論文は、拡散言語モデルへの GRPO の直接適用で発生する報酬崩壊を、確率比推定に伴うノイズによる不安定性を解消する「StableDRL」という新しい手法と階段型アテンション機構によって解決し、拡散モデルの安定した強化学習を可能にすることを提案しています。

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

ButterflyViT: 354×\times Expert Compression for Edge Vision Transformers

本論文は、エッジデバイス向けにビジョントランスフォーマーの専門家(エキスパート)を独立した重み行列ではなく共有基底からの幾何学的な再配向として表現する「ButterflyViT」を提案し、64 個の専門家において精度をほぼ損なうことなくメモリ使用量を 354 倍削減することに成功したことを報告しています。

Aryan Karmore2026-03-10💻 cs

Robotic Foundation Models for Industrial Control: A Comprehensive Survey and Readiness Assessment Framework

本論文は、産業用ロボットの制御における基盤モデルの現状を包括的に調査し、149 の具体的な基準からなる評価フレームワークを用いて 324 件のモデルを評価した結果、産業応用への成熟度は限定的であり、安全性やリアルタイム性、システム統合などの要素を体系的に組み込むことが不可欠であると結論付けています。

David Kube, Simon Hadwiger, Tobias Meisen2026-03-10💻 cs

XMACNet: An Explainable Lightweight Attention based CNN with Multi Modal Fusion for Chili Disease Classification

本論文は、可視画像と植生指数を融合し、自己注意機構と Grad-CAM++ などの説明可能性手法を組み合わせた軽量 CNN「XMACNet」を提案し、合成データ拡張により構築した新たな唐辛子病害データセット上で、既存モデルを上回る高精度かつ解釈可能な病害分類を実現したことを報告しています。

Tapon Kumer Ray, Rajkumar Y, Shalini R, Srigayathri K, Jayashree S, Lokeswari P2026-03-10💻 cs

Learning Unbiased Cluster Descriptors for Interpretable Imbalanced Concept Drift Detection

この論文は、不均衡なデータにおける概念ドリフト検出時に生じる「マスキング効果」を回避し、小規模な概念のドリフトを解釈可能かつロバストに検出するための、偏りのないクラスター記述子に基づく新しい手法「ICD3」を提案するものである。

Yiqun Zhang, Zhanpei Huang, Mingjie Zhao, Chuyao Zhang, Yang Lu, Yuzhu Ji, Fangqing Gu, An Zeng2026-03-10🤖 cs.LG

Gradient-based Nested Co-Design of Aerodynamic Shape and Control for Winged Robots

本論文は、空力形状と運動計画を個別に最適化する従来の手法の限界を克服し、ニューラルネットワークによる空力近似と勾配法に基づくネスト型共設計フレームワークを提案することで、固定翼グライダーの着地や着座といった複雑なタスクにおいて、進化アルゴリズムよりも短時間で高性能な設計を実現することを示しています。

Daniele Affinita, Mingda Xu, Benoît Valentin Gherardi, Pascal Fua2026-03-10💻 cs

Diversity-Aware Adaptive Collocation for Physics-Informed Neural Networks via Sparse QUBO Optimization and Hybrid Coresets

本論文は、物理情報ニューラルネットワーク(PINN)の訓練効率と精度を向上させるため、残差に基づく重要性と多様性を同時に考慮し、スパースな QUBO 最適化とハイブリッドなコアセット構築を用いて適応的な配置点選択を行う新たな手法を提案し、粘性ブルガース方程式のシミュレーションにおいてその有効性を検証したものである。

Hadi Salloum, Maximilian Mifsud Bonici, Sinan Ibrahim, Pavel Osinenko, Alexei Kornaev2026-03-10🤖 cs.LG

Failure Detection in Chemical Processes using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

この論文は、安全性が極めて重要な化学プロセス分野において、説明性と解釈性を備えつつ、実世界の故障データが不足している状況でもシミュレータデータを用いてランダムフォレストや多層パーセプトロンを上回る性能を発揮する記号機械学習による故障検知手法の可行性を、エチレン酸化プロセスの事例研究を通じて検証したものである。

Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, Gürkan Sin, Alessandra Russo2026-03-10🤖 cs.LG