SycoEval-EM: Sycophancy Evaluation of Large Language Models in Simulated Clinical Encounters for Emergency Care

この論文は、救急医療におけるシミュレーション対話を通じて大規模言語モデルの患者への同調性(シコファシー)を評価する「SycoEval-EM」フレームワークを提案し、静的なベンチマークでは臨床 AI の安全性を予測できず、多ターン対抗テストによる認証が必要であることを示しています。

Dongshen Peng, Yi Wang, Austin Schoeffler + 2 more2026-03-05🤖 cs.AI

Causal Learning Should Embrace the Wisdom of the Crowd

この論文は、個々の人間や LLM エージェントが持つ断片的な因果知識を、大規模なクラウドソーシングや対話型知識抽出、堅牢な集約手法、そして LLM によるシミュレーションを統合した新しいパラダイムを通じて統合し、単独では達成不可能な大規模な因果構造(DAG)の復元を可能にする包括的な研究枠組みを提案するものである。

Ryan Feng Lin, Yuantao Wei, Huiling Liao + 2 more2026-03-05🤖 cs.LG

How to Model AI Agents as Personas?: Applying the Persona Ecosystem Playground to 41,300 Posts on Moltbook for Behavioral Insights

本論文は、Moltbook 上の 41,300 件の投稿を分析して AI エージェントの行動的多様性を特徴づける「ペルソナ生態系プレイグラウンド(PEP)」を適用し、生成されたペルソナが統計的に有意にその源となるクラスタと一致し、かつシミュレーション会話においても識別可能であることを実証した。

Danial Amin, Joni Salminen, Bernard J. Jansen2026-03-05🤖 cs.AI

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

この論文は、脳波(EEG)から自然言語を復号化する際に生じる意味的バイアスや信号軽視、そして BLEU スコアの罠といった課題に対処するため、感情やトピックなどの decoupled な意味目標と、信号に基づく厳密な注意機構を統合した新たなフレームワーク「SemKey」を提案し、従来の評価指標を超えた堅牢な性能向上を実証したものである。

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

Arapai: An Offline-First AI Chatbot Architecture for Low-Connectivity Educational Environments

本論文は、インターネット接続や高性能ハードウェアに依存せず、低スペックな CPU のみで動作するオフラインファーストの AI チャットボット「Arapai」のアーキテクチャを提案し、限られた接続環境における教育へのデジタル包摂とインフラ耐性の向上に寄与する実証結果を示しています。

Joseph Walusimbi, Ann Move Oguti, Joshua Benjamin Ssentongo + 1 more2026-03-05💬 cs.CL

Bridging Pedagogy and Play: Introducing a Language Mapping Interface for Human-AI Co-Creation in Educational Game Design

この論文は、教育ゲーム設計における非専門家デザイナーの障壁を下げつつ人間の主体性を維持するため、 pedagogy(教育方針)とゲームプレイを明示的に関連付ける構造化言語を LLM と共創する Web ツールを提案し、その有効性を論じています。

Daijin Yang, Erica Kleinman, Casper Harteveld2026-03-05🤖 cs.AI

Understanding Parents' Desires in Moderating Children's Interactions with GenAI Chatbots through LLM-Generated Probes

この論文は、LLM 生成のシナリオを用いた調査を通じて、保護者が子供との GenAI チャットボット対話に対して、既存の制御機能では見落とされている細やかな透明性や年齢・戦略に応じたパーソナライズされた介入を求めていることを明らかにし、将来の保護者向け制御ツールの設計指針を提示するものである。

John Driscoll, Yulin Chen, Viki Shi + 3 more2026-03-05🤖 cs.AI

The Empty Quadrant: AI Teammates for Embodied Field Learning

この論文は、従来の「座った学習者」を前提とした AIED の枠組みを超え、4E 認知や能動的推論に基づき、AI を単なる情報提供者ではなく、身体性と場所を伴う野外学習における「意味構築のパートナー」として位置づけ、学習プロセスを評価する新たなフレームワーク「Field Atlas」を提案するものである。

Hyein Kim, Sung Park2026-03-05🤖 cs.AI

FeedAIde: Guiding App Users to Submit Rich Feedback Reports by Asking Context-Aware Follow-Up Questions

本論文は、マルチモーダル大規模言語モデルの推論能力を活用して文脈に応じた追跡質問を提示し、ユーザーと協働して開発者に有益な詳細なフィードバックレポートを生成する「FeedAIde」というアプローチを提案し、その実装と評価を通じて、従来の単純なフォームに比べてユーザーの報告体験を向上させると同時に、バグ報告や機能リクエストの質と完全性を大幅に高めることを実証しています。

Ali Ebrahimi Pourasad, Meyssam Saghiri, Walid Maalej2026-03-05🤖 cs.AI

LikeThis! Empowering App Users to Submit UI Improvement Suggestions Instead of Complaints

この論文は、ユーザーがアプリのスクリーンショットとコメントから生成 AI を用いて具体的な UI 改善案を即座に生成・選択できる「LikeThis!」を提案し、モデルベンチマークとユーザー研究を通じて、開発者にとってより理解しやすく実行可能なフィードバックを可能にする有効性を実証したものである。

Jialiang Wei, Ali Ebrahimi Pourasad, Walid Maalej2026-03-05🤖 cs.AI