CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

本論文は、従来の手法に比べて計算コストが低く手動調整が不要な、Cryo-EM 密度マップ制約を組み込んだワンステップ拡散モデル「CryoNet.Refine」を開発し、タンパク質複合体や DNA/RNA-タンパク質複合体の構造精密化を大幅に高速化・自動化する手法を提案しています。

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff Zhang2026-03-10💻 cs

A Mathematical Theory of Agency and Intelligence

この論文は、古典系における「二重予測可能性(bipredictability)」の上限が 0.5 以下であることを理論的に証明し、現在の AI は予測に基づく「主体性(agency)」は持っても学習の自己監視と適応を欠くため真の「知能(intelligence)」ではないと定義し、生物の視床 - 皮質調節に着想を得た新たなフィードバック機構を提案しています。

Wael Hafez, Chenan Wei, Rodrigo Pena, Amir Nazeri, Cameron Reid2026-03-10🔢 math

Autoregressive Visual Decoding from EEG Signals

本論文は、EEG 信号と画像表現の整合を学習し、VQ-VAE とトランスフォーマーを用いた「次スケール予測」に基づく自己回帰的生成フレームワーク「AVDE」を提案し、既存の拡散モデルよりもはるかに軽量でありながら、画像復元や検索タスクにおいて最先端の性能を達成し、人間の視覚知覚の階層性を反映する解釈可能な脳コンピュータインターフェースを実現したことを示しています。

Sicheng Dai, Hongwang Xiao, Shan Yu, Qiwei Ye2026-03-10🤖 cs.LG

Decomposing Physician Disagreement in HealthBench

HealthBench における医師間の評価不一致の大部分は構造的な要因に起因するものの、文脈欠如や曖昧な表現といった「解消可能な不確実性」が不一致を有意に増大させる一方、本質的な医学的曖昧さは影響を与えないという見解から、評価シナリオにおける情報ギャップの解消が合意率向上への具体的な改善策となり得ると結論付けています。

Satya Borgohain, Roy Mariathas2026-03-10💻 cs

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

App Store の検索ランキングにおいて、LLM を活用して生成したテキスト関連性ラベルを行動データと組み合わせることで、オフライン評価指標の改善と、特にロングテールクエリにおけるコンバージョン率の統計的有意な向上(+0.24%)を実現した。

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

PEPA: a Persistently Autonomous Embodied Agent with Personalities

本論文は、外部からの指示に依存せず、人格特性を内生的な組織原理として活用し、自律的に目標を生成・進化させることで、動的な環境における永続的な自律性を達成する新しい認知アーキテクチャ「PEPA」を提案し、実世界のロボットによる実証実験を通じてその有効性を立証したものである。

Kaige Liu, Yang Li, Lijun Zhu, Weinan Zhang2026-03-10💻 cs

How Well Do Multimodal Models Reason on ECG Signals?

本論文は、心電図信号におけるマルチモーダルモデルの推論能力を評価するため、信号パターンの正確な識別(知覚)と臨床知識の論理的適用(推論)を分離し、それぞれをコード生成による実証的検証と構造化臨床基準との照合によって評価する、スケーラブルで再現性のあるフレームワークを提案しています。

Maxwell A. Xu, Harish Haresamudram, Catherine W. Liu, Patrick Langer, Jathurshan Pradeepkumar, Wanting Mao, Sunita J. Ferns, Aradhana Verma, Jimeng Sun, Paul Schmiedmayer, Xin Liu, Daniel McDuff, Emily B. Fox, James M. Rehg2026-03-10🤖 cs.LG

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

本論文は、構造化された医薬品ラベルと自由記述の放射線レポートという異なる臨床ドメインにおいて、LLM の抽出結果に対する信頼性の方向性が逆転することを発見し、ドメイン固有のコンフォーマル予測フレームワークを用いて、いずれの領域でも安全な臨床展開を可能にする有限サンプルの被覆保証を実現したことを報告しています。

Manil Shrestha, Edward Kim2026-03-10💬 cs.CL

Extended Empirical Validation of the Explainability Solution Space

本技術報告書は、従業員離職予測および都市リソース配分システムという異なるドメインでの評価を通じて、説明性 AI 戦略設計のための汎用的な意思決定支援ツールとしての「説明性ソリューション空間(ESS)」フレームワークの妥当性を拡張的に実証したものである。

Antoni Mestre, Manoli Albert, Miriam Gil, Vicente Pelechano2026-03-10💻 cs

Opponent State Inference Under Partial Observability: An HMM-POMDP Framework for 2026 Formula 1 Energy Strategy

2026 年の F1 新規定における不完全観測条件下でのエネルギー戦略最適化のため、競合他車の隠れた状態を隠れマルコフモデルで推論し、その推論結果を Deep Q-Network に投入して意思決定を行う 2 層フレームワークを提案し、敵の欺瞞的な「カウンターハーベスト」戦略の検出や ERS 状態の高精度推定を実現する手法を示しています。

Kalliopi Kleisarchaki2026-03-10🤖 cs.LG

HarmonyCell: Automating Single-Cell Perturbation Modeling under Semantic and Distribution Shifts

本論文は、メタデータの意味的異質性と統計的分布シフトという二重の課題を、LLM 駆動のセマンティック統一化と階層的行動空間における適応的モンテカルロ木探索によるアーキテクチャ合成という二つの専用メカニズムで解決し、人手を介さずに単一細胞干渉実験の自動モデル構築を実現する「HarmonyCell」というエンドツーエンドのエージェントフレームワークを提案するものである。

Wenxuan Huang, Mingyu Tsoi, Yanhao Huang, Xinjie Mao, Xue Xia, Hao Wu, Jiaqi Wei, Yuejin Yang, Lang Yu, Cheng Tan, Xiang Zhang, Zhangyang Gao, Siqi Sun2026-03-10💻 cs

LLM-assisted Semantic Option Discovery for Facilitating Adaptive Deep Reinforcement Learning

この論文は、大規模言語モデル(LLM)を活用して自然言語指示を実行可能なルールに変換し、セマンティックなアノテーション付きのオプションを自動生成する閉ループフレームワークを提案することで、深層強化学習のデータ効率、解釈性、および環境間での転移性を向上させる手法を提示し、Office World や Montezuma's Revenge などの実験でその有効性を実証したものである。

Chang Yao, Jinghui Qin, Kebing Jin, Hankz Hankui Zhuo2026-03-10💻 cs

A Detection-Gated Pipeline for Robust Glottal Area Waveform Extraction and Clinical Pathology Assessment

この論文は、局所化器とセグメンテーション器を統合し、時間的一貫性ラッパーを備えた検出ゲート型パイプラインを提案することで、高速度ビデオエンドスコピーにおける喉頭領域波形の抽出精度と臨床的病理評価のための生体マーカーの一般化性を飛躍的に向上させたことを報告しています。

Harikrishnan Unnikrishnan2026-03-10🤖 cs.LG

Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

本論文は、メコンデルタの無形文化遺産画像分類におけるデータ不足と過学習の問題に対し、CoAtNet 構造とモデルスープ(モデルの重み平均化)を組み合わせることで、分散を低減し、既存の強固なベースラインを凌ぐ最先端の精度を達成したことを示しています。

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

Agentified Assessment of Logical Reasoning Agents

本論文は、評価プロセス自体の再現性、監査可能性、実行失敗への耐性を確保するための「エージェント化された評価」フレームワークを提案し、FOLIO データセットを用いた自動形式化エージェントのベンチマークにおいて、従来の連鎖推論ベースラインを上回る 86.70% の精度を達成したことを示しています。

Zhiyu Ni, Yifeng Xiao, Zheng Liang2026-03-10💻 cs