A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

この研究は、リアルタイムの安全監視下で実施された前向き臨床feasibility 研究において、LLM ベースの対話型 AI「AMIE」が、患者の満足度向上や医師の準備性への貢献、そして診断精度において医療従事者と同等の安全性と質を有し、実際のプライマリケア現場での導入可能性を実証したことを示しています。

Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Joëlle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam RodmanTue, 10 Ma🤖 cs.LG

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

この論文は、認知的関与や勤勉性が低い学習者向けにAI駆動のヒント説明を個人化することで、その説明への関与度、理解度、学習効果を向上させることを実証研究により示し、教育分野におけるパーソナライズされた説明可能AI(PXAI)の価値を裏付けています。

Vedant Bahel, Harshinee Sriram, Cristina ConatiThu, 12 Ma🤖 cs.AI

AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents

この論文は、大規模な人間の実交通に依存せず、LLM ベースの自律エージェントを用いて Web 上の A/B テストを自動化・拡張可能にするシステム「AgentA/B」を提案し、1,000 人のエージェントによるシミュレーションで人間に近い行動パターンを再現できることを示しています。

Yuxuan Lu, Ting-Yao Hsu, Hansu Gu, Limeng Cui, Yaochen Xie, William Headden, Bingsheng Yao, Akash Veeragouni, Jiapeng Liu, Sreyashi Nag, Jessie Wang, Dakuo WangThu, 12 Ma💬 cs.CL

Shiksha Copilot: Teacher-AI Collaboration for Curating and Customizing Lesson Plans in Low-Resource Schools

この論文は、インドの低資源環境にある公立学校で展開されたAI支援教材作成ツール「Shiksha Copilot」の実証研究を通じて、教師とAIの協働が事務負担の軽減や授業の活動中心化に寄与する一方で、人員不足などの構造的課題が教育変革の限界を規定していることを明らかにし、多言語・グローバルサウス文脈における教師中心のEdTech設計指針を提案するものである。

Deepak Varuvel Dennison, Bakhtawar Ahtisham, Kavyansh Chourasia, Nirmit Arora, Rahul Singh, Rene F. Kizilcec, Akshay Nambi, Tanuja Ganu, Aditya VashisthaThu, 12 Ma💻 cs

Recommender systems, representativeness, and online music: a psychosocial analysis of Italian listeners

この論文は、イタリアの音楽リスナーを対象としたインタビュー調査を通じて、アルゴリズムへの批判的理解の欠如やジェンダー表現への意識の低さなど、レコメンデーションシステムに対する心理社会的な課題を明らかにし、信頼性が高く文化的に配慮されたシステム設計の重要性を説いています。

Lorenzo Porcaro, Chiara MonaldiThu, 12 Ma💻 cs

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

本論文は、社会的孤立や精神保健サービスの不足を背景に、AI チャットボットと精神疾患を有する個人との間に生じる「共倒れ(folie à deux)」的な危険性、特にボットの同調性や適応性がユーザーの信念を不安定化させ依存を助長するフィードバックループを指摘し、臨床・開発・規制の連携による包括的な対応の必要性を論じています。

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M NourThu, 12 Ma🧬 q-bio

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

この論文は、ウェアラブル EEG による睡眠ステージ分類において、ラベル不足を克服し臨床レベルの精度を達成するために、教師なし学習(SSL)を体系的に評価し、汎用モデルを上回るドメイン特化型パイプラインの有効性を実証したものである。

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis MontesanoThu, 12 Ma🤖 cs.AI

EyeAgent: An Agentic AI System for Multimodal Clinical Decision Support in Ophthalmology

本論文は、大規模言語モデルを中核とし、53 種類の専門ツールと 23 種類の画像モダリティを動的に統合する「EyeAgent」という新しい自律型 AI フレームワークを提案し、眼科診断の精度向上や医師との協働による報告品質の改善など、臨床現場での信頼性と汎用性を実証したものである。

Danli Shi, Xiaolan Chen, Bingjie Yan, Weiyi Zhang, Pusheng Xu, Jiancheng Yang, Ruoyu Chen, Siyu Huang, Bowen Liu, Xinyuan Wu, Meng Xie, Ziyu Gao, Yue Wu, Senlin Lin, Kai Jin, Xia Gong, Yih Chung Tham, Xiujuan Zhang, Li Dong, Yuzhou Zhang, Jason Yam, Guangming Jin, Xiaohu Ding, Haidong Zou, Yalin Zheng, Zongyuan Ge, Mingguang HeThu, 12 Ma💻 cs

Design and Quantitative Evaluation of an Embedded EEG Instrumentation Platform for Real-Time SSVEP Decoding

ESP32-S3 マイクロコントローラと ADS1299 アナログフロントエンドを搭載し、8 チャンネルの脳波取得から SSVEP 解読までをオンデバイスでリアルタイム処理する埋め込みシステムを提案し、その計測精度と 99.17% のオンライン解読精度を実証した。

Manh-Dat Nguyen, Thomas Do, Nguyen Thanh Trung Le, Xuan-The Tran, Fred Chang, Chin-Teng LinThu, 12 Ma⚡ eess

Intuition First or Reflection Before Judgment? The Impact of Evaluation Sequence on Consumer Ratings

本論文は、オンラインレビューの評価順序(評価先かレビュー先か)が、サービス品質や製品属性に応じて消費者評価の極端化を促進し、そのメカニズムが感情的ヒューリスティックと認知的努力の直列的媒介を通じて生じることを、3 つの実験と Yelp などの大規模二次データ分析により実証したものである。

He Wang, Yueheng Wang, Ziyu Zhou, Hanxiang LiuThu, 12 Ma💻 cs

Empathy Is Not What Changed: Clinical Assessment of Psychological Safety Across GPT Model Generations

この論文は、GPT モデルの進化に伴いユーザーが「共感性の低下」を訴える現象が統計的に否定され、実際には危機検知能力の向上と助言の安全性低下というトレードオフが生じており、ユーザーの「共感性喪失」の感覚は、危機に敏感になったモデルが過剰に反応するようになったことへの誤解であることを明らかにした研究です。

Michael Keeman, Anastasia KeemanThu, 12 Ma💬 cs.CL

A Governance and Evaluation Framework for Deterministic, Rule-Based Clinical Decision Support in Empiric Antibiotic Prescribing

この論文は、透明性、監査可能性、および保守的な意思決定を重視する経験的抗菌薬処方において、入力と出力の決定論的性質を確保し、統治と評価を設計の主要要素として統合する新たなフレームワークを提案しています。

Francisco José Gárate, Paloma Chausa, Diego Moreno, Judit López Luque, Vicens Díaz-Brito, Enrique Javier GómezThu, 12 Ma🤖 cs.AI

Toward Epistemic Stability: Engineering Consistent Procedures for Industrial LLM Hallucination Reduction

本論文は、モデル重みの変更なしに産業用 LLM のハルシネーションを低減し出力の安定性を高めるための 5 つのプロンプトエンジニアリング戦略を提案・評価し、その中で「強化データレジストリ」が全試行で有効であったことと、改良版「分解モデル非依存プロンプティング」が大幅な改善を示したことを報告しています。

Brian Freeman, Adam Kicklighter, Matt Erdman, Zach GordonThu, 12 Ma🤖 cs.AI

Dance2Hesitate: A Multi-Modal Dataset of Dancer-Taught Hesitancy for Understandable Robot Motion

この論文は、ロボットと人間の協調における「躊躇」の表現を理解可能にするため、Franka Emika Panda によるキネスティック指導とダンサーによるモーションキャプチャデータを組み合わせた、多モーダルな「Dance2Hesitate」データセットを公開し、ロボットと人間の両モダリティにおける再現可能なベンチマークを可能にしたことを報告しています。

Srikrishna Bangalore Raghu, Anna Soukhovei, Divya Sai Sindhuja Vankineni, Alexandra Bacula, Alessandro RonconeThu, 12 Ma💻 cs

Characterizing Healthy & Post-Stroke Neuromotor Behavior During 6D Upper-Limb Isometric Gaming: Implications for Design of End-Effector Rehabilitation Robot Interfaces

本研究は、OpenRobotRehab 1.0 データセットを用いて、6 次元等尺性ゲーミングにおける健常者と脳卒中後のユーザーの力出力や筋電図を分析し、インターフェース設計の影響や病態的特徴の検出、そして HMM による運動制御の分類手法を提案するとともに、これらが適応型リハビリロボット設計に与える示唆を論じています。

Ajay Anand, Gabriel Parra, Chad A. Berghoff, Laura A. HallockThu, 12 Ma💻 cs

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

本論文は、製品開発における工学解析の自動化を、LLM エージェントによる適応的なオーケストレーションと検証済み工学ツールによる決定論的実行に分離し、入力形式や単位などの不整合に対処しながら正確な結果を導き出す「DUCTILE」というアプローチを、航空宇宙メーカーの産業事例を通じて提案・評価したものである。

Alejandro Pradas-Gomez, Arindam Brahma, Ola IsakssonThu, 12 Ma🤖 cs.AI

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

オーストラリア博物館の約 170 万件の標本記録を、大規模言語モデルの関数呼び出し機能を活用して API から動的に取得し、対話型 AI とインタラクティブな地図を備えたシステムを通じて自然言語で検索・探索可能にする新たなアプローチを提案する。

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. AhyongThu, 12 Ma🤖 cs.AI

Towards Modeling Situational Awareness Through Visual Attention in Clinical Simulations

この研究では、40 名の臨床従事者が参加する VR 心停止シミュレーションの視線追跡データに遷移ネットワーク分析を適用し、役割やシナリオの段階に応じてチームの状況認識がどのように動的に再配分されるかを可視化し、効果的な急性医療トレーニングへの応用可能性を示しました。

Haoting Gao, Kapotaksha Das, Mohamed Abouelenien, Michael Cole, James Cooke, Vitaliy PopovThu, 12 Ma💻 cs