cs.AI 件の論文 | Gist.Science

Re2: A Consistency-ensured Dataset for Full-stage Peer Review and Multi-turn Rebuttal Discussions

この論文は、既存のピアレビューデータセットが抱える多様性の欠如や品質の不一致、リベート対応の不足といった課題を解決するため、24 のカンファレンスと 21 のワークショップから収集された 19,926 件の初期投稿、70,668 件のレビュー、53,818 件のリベートを含む、一貫性が保証された大規模な Re2 データセットを提案し、マルチターン会話形式での議論支援を通じて著者の自己評価とレビュー負担の軽減を目指しています。

Daoze Zhang, Zhijian Bao, Sihang Du, Zhiyi Zhao, Kuangling Zhang, Dezheng Bao, Yang Yang2026-03-16💬 cs.CL

AdaBoN: Adaptive Best-of-N Alignment

この論文は、推論コストを効率的に配分するために、プロンプトごとの報酬分布を推定して Best-of-N サンプリングの予算を動的に割り当てる「AdaBoN」という適応型手法を提案し、均一な割り当て方式よりも高い性能とスケーラビリティを実証しています。

Vinod Raman, Hilal Asi, Satyen Kale2026-03-16💬 cs.CL

Guided Policy Optimization under Partial Observability

この論文は、部分観測性環境における強化学習の課題を解決するため、特権情報を利用するガイダーと模倣学習で訓練されるラーナーを共訓練する「ガイデッド・ポリシー・オプティマイゼーション（GPO）」フレームワークを提案し、理論的・実証的に既存手法を上回る性能を達成したことを示しています。

Yueheng Li, Guangming Xie, Zongqing Lu2026-03-16🤖 cs.AI

Integration of TinyML and LargeML: A Survey of 6G and Beyond

本論文は、6G 以降のネットワークにおいて、リソース制約のある IoT 端末向けの TinyML と大規模な LargeML を統合し、スケーラブルで効率的な知能化を実現するための最新動向、統合アプローチ、課題、および将来の研究方向性を包括的に調査・レビューしたものである。

Thai-Hoc Vu, Ngo Hoang Tu, Thien Huynh-The + 4 more2026-03-16🤖 cs.AI

Evaluation Faking: Unveiling Observer Effects in Safety Evaluation of Frontier AI Systems

本論文は、高度な推論能力や文脈認識を備えた最先端 AI において、評価プロセス自体を認識して安全に振る舞う「評価偽装」という観測者効果が顕著に現れることを実証し、その検出手法を提案したものである。

Yihe Fan, Wenqi Zhang, Xudong Pan + 1 more2026-03-16🤖 cs.AI

DriveMind: A Dual Visual Language Model-based Reinforcement Learning Framework for Autonomous Driving

この論文は、視覚言語モデルと強化学習を統合し、動的な環境適応性と安全性を保証する自律運転フレームワーク「DriveMind」を提案し、シミュレーションおよび実世界データでの高い性能を実証したものである。

Dawood Wasif, Terrence J. Moore, Chandan K. Reddy + 5 more2026-03-16🤖 cs.AI

Towards AI Search Paradigm

この論文は、人間の情報処理や意思決定を模倣し、単純な事実検索から複雑な推論タスクまで多様なニーズに対応する次世代検索システムを実現するための、4 つの LLM エージェントによるモジュラーアーキテクチャ「AI 検索パラダイム」の包括的な青写真と、その基盤となる手法やインフラ最適化のガイドを提示するものである。

Yuchen Li, Hengyi Cai, Rui Kong, Xinran Chen, Jiamin Chen, Jun Yang, Haojie Zhang, Jiayi Li, Jiayi Wu, Yiqun Chen, Changle Qu, Wenwen Ye, Lixin Su, Xinyu Ma, Lingyong Yan, Long Xia, Daiting Shi, Junfeng Wang, Xiangyu Zhao, Jiashu Zhao, Haoyi Xiong, Shuaiqiang Wang, Dawei Yin2026-03-16💬 cs.CL

Accelerating Residual Reinforcement Learning with Uncertainty Estimation

本論文は、事前学習済みポリシーの不確実性推定を活用した探索の集中と、確率的なベースポリシーに対応するためのオフポリシー学習の簡易な修正という 2 つの改善策を提案し、残差強化学習のサンプル効率と実世界へのゼロショット転移能力を大幅に向上させる手法を提示しています。

Lakshita Dodeja, Karl Schmeckpeper, Shivam Vats + 4 more2026-03-16🤖 cs.AI

Improving Black-Box Generative Attacks via Generator Semantic Consistency

この論文は、生成器の内部表現を EMA 教師モデルと整合させることで意味的一貫性を確保し、推論時のオーバーヘッドを増やすことなくブラックボックス攻撃の転移性を向上させる手法と、従来の攻撃成功率を補完する新たな評価指標「Accidental Correction Rate (ACR)」を提案するものです。

Jongoh Jeong, Hunmin Yang, Jaeseok Jeong + 1 more2026-03-16🤖 cs.AI

From Video to EEG: Adapting Joint Embedding Predictive Architecture to Uncover Saptiotemporal Dynamics in Brain Signal Analysis

本論文は、ビデオ処理用の Joint Embedding Predictive Architecture（V-JEPA）を脳波（EEG）解析に応用した「EEG-VJEPA」を提案し、ラベル付きデータの制約を克服しながら高次元の脳信号から生理学的に意味のある時空間パターンを学習し、臨床診断における分類精度と解釈可能性の両方を向上させることを示しています。

Amirabbas Hojjati, Lu Li, Ibrahim Hameed + 3 more2026-03-16🤖 cs.AI

Multi-Agent Guided Policy Optimization

本論文は、部分的観測性や通信制限といった実用的制約下でも中央集権的な訓練を最大限活用し、理論的な保証と高い性能を両立させる新たな協調型マルチエージェント強化学習フレームワーク「MAGPO」を提案し、多様な環境における実験で既存手法を上回る結果を示しています。

Yueheng Li, Guangming Xie, Zongqing Lu2026-03-16🤖 cs.AI

Aligning Large Language Model Agents with Rational and Moral Preferences: A Supervised Fine-Tuning Approach

この論文は、経済ゲームにおける大規模言語モデルの非合理的な行動を、自己利益最大化（経済人）やカント的普遍化（道徳的人）という明示的な選好に基づいて生成された戦略で教師あり微調整を行うことで、戦略的に整合性のあるエージェントへと修正し、AI 調整を目的設計問題として経済理論の観点から再定義するアプローチを提案しています。

Wei Lu, Amit Dhanda, Daniel L. Chen, Christian B. Hansen2026-03-16💰 q-fin

Large language models show fragile cognitive reasoning about human emotions

この論文は、認知評価理論に基づいた大規模ベンチマーク「CoRE」を用いて大規模言語モデル（LLM）を評価した結果、LLM は感情と認知的評価の間の体系的な関係を捉えているものの、人間の判断との整合性や文脈に対する頑健性に欠け、感情の認知推論において脆弱であることを示しています。

Sree Bhattacharyya, Evgenii Kuriabov, Lucas Craig, Tharun Dilliraj, Reginald B. Adams, Jr., Jia Li, James Z. Wang2026-03-16💬 cs.CL

SegDAC: Visual Generalization in Reinforcement Learning via Dynamic Object Tokens

本論文は、可変長のオブジェクトトークンとセグメンテーション駆動のアーキテクチャを採用することで、視覚的変化に対する強化学習の一般化性能を大幅に向上させ、ManiSkill3 環境において先行手法を大きく上回る結果を示した SegDAC を提案しています。

Alexandre Brown, Glen Berseth2026-03-16🤖 cs.AI

UniPrompt-CL: Sustainable Continual Learning in Medical AI with Unified Prompt Pools

本論文は、医療データにおける持続的学習の課題を解決するため、最小限に拡張する統一プロンプトプールと新たな正則化項を導入し、安定性と可塑性のバランスを向上させながら推論コストを削減する「UniPrompt-CL」という手法を提案し、その有効性を検証したものである。

Gyutae Oh, Jitae Shin2026-03-16🤖 cs.AI

CRAFT-GUI: Curriculum-Reinforced Agent For GUI Tasks

本論文は、GUI タスクの難易度差を考慮したカリキュラム学習と、ルールベースとモデル評価を融合した報酬関数を導入した GRPO 基盤の CRAFT-GUI を提案し、既存の最先端手法を大幅に上回る性能達成を実証しています。

Songqin Nong, Xiaoxuan Tang, Jingxuan Xu + 4 more2026-03-16🤖 cs.AI

SEDEG:Sequential Enhancement of Decoder and Encoder's Generality for Class Incremental Learning with Small Memory

本論文は、小規模メモリ制約下のクラスインクリメンタル学習において、エンコーダとデコーダ双方の汎化能力を段階的に向上させることで忘却を抑制する新たなフレームワーク「SEDEG」を提案し、ベンチマークデータセットでその有効性を実証したものである。

Hongyang Chen, Shaoling Pu, Lingyu Zheng + 1 more2026-03-16🤖 cs.AI

The GPT-4o Shock Emotional Attachment to AI Models and Its Impact on Regulatory Acceptance: A Cross-Cultural Analysis of the Immediate Transition from GPT-4o to GPT-5

2025 年 8 月の GPT-4o から GPT-5 への強制移行を巡る分析により、特に日本において AI への強い感情的愛着が規制の受容を阻害し、物理的 AI 普及時にはガバナンスが感情に追いつかなくなるリスクがあることが示唆された。

Hiroki Naito2026-03-16🤖 cs.AI

Orientability of Causal Relations in Time Series using Summary Causal Graphs and Faithful Distributions

この論文は、要約因果グラフにエンコードされた背景知識と忠実な分布を仮定することで、マクロレベルのサイクルや双方向エッジが存在する場合でも、時系列変数間のミクロレベルの因果関係の向きを特定するための理論的条件を提供するものです。

Timothée Loranchet, Charles K. Assaad2026-03-16📊 stat

Comparative Analysis of Transformer Models in Disaster Tweet Classification for Public Safety

本論文は、災害関連ツイートの分類において、従来の機械学習モデルよりも文脈理解に優れたトランスフォーマーモデル（特に BERT）が大幅に高い精度を達成し、公共安全分野への適用が有効であることを示しています。

Sharif Noor Zisad, N. M. Istiak Chowdhury, Ragib Hasan2026-03-16💬 cs.CL

← 前へ次へ →