Multi-head automated segmentation by incorporating detection head into the contextual layer neural network

この論文は、スライス単位の構造検出を並列に行う検出ヘッドを統合し、その出力でセグメンテーション予測を制御するゲート付きマルチヘッド・トランスフォーマー・アーキテクチャを提案することで、解剖学的に存在しないスライスにおける偽陽性(ハルシネーション)を効果的に抑制し、放射線治療における自動セグメンテーションの信頼性と解剖学的妥当性を大幅に向上させることを示しています。

Edwin Kys, Febian Febian2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

本論文は、事前学習済みトランスフォーマーの重みを修正することなく、モンテカルロドロップアウトを用いてアテンション機構にエピステミック不確実性を組み込む「UAT-LITE」を提案し、分布外データにおける選択的予測性能の向上と予測の不確実性の改善を実現するものです。

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

この論文は、単一画像からの法線推定における 3 次元位置の不一致問題を解決するため、法線推定を画像生成モデルを用いたシェーディングシーケンス推定として再定義し、合成データで学習した RoSE という手法を提案し、実世界ベンチマークで最先端の性能を達成したことを報告しています。

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song Bai2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

この論文は、インフルエンス関数を用いてトレーニングデータに微小な編集を加えることで、モデルの動作を意図的に誘発・制御する「Infusion」というフレームワークを提案し、画像および言語タスクにおいてその有効性とアーキテクチャ間での転移性を示しています。

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

この論文は、経験再生、学習可能なリーキー・インテグレート・アンド・ファイア(LIF)ニューロンパラメータ、および適応型スパイクスケジューラを統合したエネルギー意識スパイク予算枠組みを提案し、フレームベースおよびイベントベースの両方のデータセットにおいて、精度向上とエネルギー効率の最適化を同時に実現するスパイクニューラルネットワークの継続学習手法を開発したものである。

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

この論文は、拡散モデルの推論遅延を軽減しつつ中間軌道の構造情報を保持するために、教師の軌道の各離散ステップに対応する複数のブランチを備えた学生モデルを提案し、密な軌道アライメントを通じて生成品質を向上させる「B-DENSE」と呼ばれる新しいフレームワークを紹介しています。

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

従来の回折光学ニューラルネットワークの限界を克服するため、GLU に着想を得た再構成可能な自己変調非線形性と再帰的アーキテクチャを統合し、極めて低い電力消費で高精度な光学計算を実現する「ReDON」と呼ばれる新しい光学ニューラルプロセッサが提案されています。

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

この論文は、多領域の安全制約を含む PDDL3 ベンチマークの構築と、形式検証に基づく報酬機械を用いた GRPO による二段階ポストトレーニングを導入することで、タスク計画の安全性と未知の安全特性への汎化能力を大幅に向上させた「SafeGen-LLM」を提案し、既存の最先端モデルを上回る性能を実証したものである。

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

本論文は、拡散言語モデルが抱える「因数分解の壁」を、Transformer の出力分布を完全な因数分解から軽量な確率的推論層へ置き換える「結合離散拡散(CoDD)」というハイブリッド枠組みによって打破し、低コストかつ低遅延で高品質な並列生成を実現することを提案しています。

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

本論文は、sparse 教師ありセグメンテーション、知識に基づく制約推論、多基準意思決定分析という 3 つの手法を統合したニューロ記号フレームワーク「OrthoAI」を提案し、マウスピース矯正における 3D 歯のセグメンテーションと生体力学的妥当性の推論を自動化するものである。

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

この論文は、Grounding DINO 1.5 と YOLOv11 を検出器として、Segment Anything Model 2.1(SAM 2.1)を共有バックボーンに用いた二重パイプライン手法を提案し、鳥の画像セグメンテーションにおいてゼロショットおよび教師あり学習の両方で従来の手法を上回る性能を達成したことを報告しています。

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

この論文は、トレーニング時に特権的な 4 次元情報(3D 点の軌跡予測)を活用して VLA モデルに物理的な世界動態の理解を付与する「Pri4R」を提案し、推論時のオーバーヘッドなしにロボット操作タスクの性能を大幅に向上させることを示しています。

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

本論文は、LLM の推論能力の向上に伴い、従来の木探索よりも効率的な勾配ベースの最適化パラダイムを採用した MLE エージェント「Gome」を提案し、MLE-Bench で最先端の性能を達成するとともに、モデルの推論能力が高まるにつれて勾配ベースのアプローチが木探索を上回ることを実証しています。

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

この論文は、疎な報酬環境や欺瞞的なシナリオにおいて従来の分散モンテカルロ木探索(Dec-MCTS)よりも優れた性能を発揮するよう、確率的なボルツマン方策と減衰エントロピーボーナスを導入した協調ボルツマン MCTS(CB-MCTS)を提案し、その有効性をシミュレーションで実証したものである。

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

この論文は、企業の文書から文脈を抽出し、LLM を活用してニュースをマクロ・セクター・関連企業・対象企業の 4 段階に分類する意味ベースの多段階ペアリング手法を提案し、これにより従来のキーワードマッチングでは捉えきれなかった複雑な市場依存関係を反映した高品質な金融テキスト対時系列データセット「FinTexTS」を構築し、株価予測の精度向上を実証したものである。

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI