Re2: A Consistency-ensured Dataset for Full-stage Peer Review and Multi-turn Rebuttal Discussions

この論文は、既存のピアレビューデータセットが抱える多様性の欠如や品質の不一致、リベート対応の不足といった課題を解決するため、24 のカンファレンスと 21 のワークショップから収集された 19,926 件の初期投稿、70,668 件のレビュー、53,818 件のリベートを含む、一貫性が保証された大規模な Re2 データセットを提案し、マルチターン会話形式での議論支援を通じて著者の自己評価とレビュー負担の軽減を目指しています。

Daoze Zhang, Zhijian Bao, Sihang Du, Zhiyi Zhao, Kuangling Zhang, Dezheng Bao, Yang Yang2026-03-16💬 cs.CL

Guided Policy Optimization under Partial Observability

この論文は、部分観測性環境における強化学習の課題を解決するため、特権情報を利用するガイダーと模倣学習で訓練されるラーナーを共訓練する「ガイデッド・ポリシー・オプティマイゼーション(GPO)」フレームワークを提案し、理論的・実証的に既存手法を上回る性能を達成したことを示しています。

Yueheng Li, Guangming Xie, Zongqing Lu2026-03-16🤖 cs.AI

Towards AI Search Paradigm

この論文は、人間の情報処理や意思決定を模倣し、単純な事実検索から複雑な推論タスクまで多様なニーズに対応する次世代検索システムを実現するための、4 つの LLM エージェントによるモジュラーアーキテクチャ「AI 検索パラダイム」の包括的な青写真と、その基盤となる手法やインフラ最適化のガイドを提示するものである。

Yuchen Li, Hengyi Cai, Rui Kong, Xinran Chen, Jiamin Chen, Jun Yang, Haojie Zhang, Jiayi Li, Jiayi Wu, Yiqun Chen, Changle Qu, Wenwen Ye, Lixin Su, Xinyu Ma, Lingyong Yan, Long Xia, Daiting Shi, Junfeng Wang, Xiangyu Zhao, Jiashu Zhao, Haoyi Xiong, Shuaiqiang Wang, Dawei Yin2026-03-16💬 cs.CL

Accelerating Residual Reinforcement Learning with Uncertainty Estimation

本論文は、事前学習済みポリシーの不確実性推定を活用した探索の集中と、確率的なベースポリシーに対応するためのオフポリシー学習の簡易な修正という 2 つの改善策を提案し、残差強化学習のサンプル効率と実世界へのゼロショット転移能力を大幅に向上させる手法を提示しています。

Lakshita Dodeja, Karl Schmeckpeper, Shivam Vats + 4 more2026-03-16🤖 cs.AI

Improving Black-Box Generative Attacks via Generator Semantic Consistency

この論文は、生成器の内部表現を EMA 教師モデルと整合させることで意味的一貫性を確保し、推論時のオーバーヘッドを増やすことなくブラックボックス攻撃の転移性を向上させる手法と、従来の攻撃成功率を補完する新たな評価指標「Accidental Correction Rate (ACR)」を提案するものです。

Jongoh Jeong, Hunmin Yang, Jaeseok Jeong + 1 more2026-03-16🤖 cs.AI

From Video to EEG: Adapting Joint Embedding Predictive Architecture to Uncover Saptiotemporal Dynamics in Brain Signal Analysis

本論文は、ビデオ処理用の Joint Embedding Predictive Architecture(V-JEPA)を脳波(EEG)解析に応用した「EEG-VJEPA」を提案し、ラベル付きデータの制約を克服しながら高次元の脳信号から生理学的に意味のある時空間パターンを学習し、臨床診断における分類精度と解釈可能性の両方を向上させることを示しています。

Amirabbas Hojjati, Lu Li, Ibrahim Hameed + 3 more2026-03-16🤖 cs.AI

Aligning Large Language Model Agents with Rational and Moral Preferences: A Supervised Fine-Tuning Approach

この論文は、経済ゲームにおける大規模言語モデルの非合理的な行動を、自己利益最大化(経済人)やカント的普遍化(道徳的人)という明示的な選好に基づいて生成された戦略で教師あり微調整を行うことで、戦略的に整合性のあるエージェントへと修正し、AI 調整を目的設計問題として経済理論の観点から再定義するアプローチを提案しています。

Wei Lu, Amit Dhanda, Daniel L. Chen, Christian B. Hansen2026-03-16💰 q-fin

Large language models show fragile cognitive reasoning about human emotions

この論文は、認知評価理論に基づいた大規模ベンチマーク「CoRE」を用いて大規模言語モデル(LLM)を評価した結果、LLM は感情と認知的評価の間の体系的な関係を捉えているものの、人間の判断との整合性や文脈に対する頑健性に欠け、感情の認知推論において脆弱であることを示しています。

Sree Bhattacharyya, Evgenii Kuriabov, Lucas Craig, Tharun Dilliraj, Reginald B. Adams, Jr., Jia Li, James Z. Wang2026-03-16💬 cs.CL

SEDEG:Sequential Enhancement of Decoder and Encoder's Generality for Class Incremental Learning with Small Memory

本論文は、小規模メモリ制約下のクラスインクリメンタル学習において、エンコーダとデコーダ双方の汎化能力を段階的に向上させることで忘却を抑制する新たなフレームワーク「SEDEG」を提案し、ベンチマークデータセットでその有効性を実証したものである。

Hongyang Chen, Shaoling Pu, Lingyu Zheng + 1 more2026-03-16🤖 cs.AI