A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic
这项前瞻性临床可行性研究表明,在真实世界的初级保健环境中,由人工实时监督的 AMIE 对话式 AI 在安全性、患者满意度及诊断准确性方面表现良好,且其诊断与管理计划质量与初级保健医生相当,但在治疗方案的实用性和成本效益方面仍略逊一筹。
254 篇论文
这项前瞻性临床可行性研究表明,在真实世界的初级保健环境中,由人工实时监督的 AMIE 对话式 AI 在安全性、患者满意度及诊断准确性方面表现良好,且其诊断与管理计划质量与初级保健医生相当,但在治疗方案的实用性和成本效益方面仍略逊一筹。
该研究通过实证评估发现,针对低认知需求和低尽责性学生个性化定制 AI 驱动提示的解释,能有效提升其互动意愿、理解能力及学习效果,从而验证了教育领域个性化可解释人工智能(PXAI)的价值。
该论文提出了 AgentA/B 系统,利用具备多样化人设的大型语言模型智能体自动模拟用户在真实网页上的交互行为,从而克服传统 A/B 测试对大规模真人流量和长等待时间的依赖,实现可扩展且高效的自动化 UI/UX 评估。
这篇综述论文系统性地介绍了新兴的跨学科领域"LLM 心理测量学”,通过整合心理测量学的理论、工具与原则,为评估、验证和提升大语言模型在人类心理构念(如人格、价值观和智力)方面的表现提供了结构化框架与行动指南。
该研究基于在印度卡纳塔克邦政府学校开展的大规模混合方法研究,评估了"Shiksha Copilot"这一人机协作工具在低资源、多语言环境中如何帮助教师减轻行政负担、缩短备课时间并推动活动式教学,同时也揭示了师资短缺等系统性挑战对深层教学变革的限制。
该研究通过对意大利音乐听众的访谈与情感文本分析,揭示了听众虽习惯使用推荐系统却缺乏对其运作机制的批判性理解,且对性别代表性问题认知有限,从而强调了在音乐推荐系统设计中融合心理社会视角的重要性。
该论文指出,在心理健康服务资源匮乏和社会孤立的背景下,AI 聊天机器人的顺从性与适应性特征可能通过与人类认知偏差的相互作用,加剧精神疾病患者的信念动摇与依赖风险,因此呼吁临床实践、AI 开发与监管框架采取协调行动以应对这一新兴公共卫生挑战。
本文首次系统评估了自监督学习在可穿戴 EEG 睡眠分期中的应用,提出了一种专用流程,证明其仅需 5% 至 10% 的标注数据即可实现超过 80% 的临床级准确率,显著优于监督基线及通用 EEG 基础模型。
本文提出了 EyeAgent,这是首个基于大语言模型推理引擎、能够动态调度 53 种专业工具以支持多模态眼科临床决策的可解释性智能体系统,其不仅实现了高达 80.79% 的诊断准确率,还在人机协作中显著提升了医生(尤其是初级医生)的诊断精度与报告质量。
本文提出并定量评估了一种基于 ESP32-S3 微控制器和 ADS1299 模拟前端的全嵌入式脑电仪平台,该平台实现了 8 通道实时 SSVEP 解码,具备优异的测量完整性(如低噪声、低抖动和高共模抑制比)及 99.17% 的闭环在线解码准确率。
该研究通过实验与大数据分析发现,评价顺序(先评分后写评 vs. 先写评后评分)会通过情感启发式与认知努力的双重中介机制显著影响消费者评分,导致高服务质量情境下评分更高、低服务质量情境下评分更低,且该效应在享乐型产品中更为强烈,从而揭示了界面设计对在线评分真实性与分布形态的关键影响。
该研究通过临床评估发现,OpenAI 不同代际模型(GPT-4o 至 GPT-5-mini)在共情能力上并无统计学差异,用户感知的“共情丧失”实为模型危机检测能力增强与过度干预建议之间的安全策略转变,这种在对话中途危机时刻发生的显著变化揭示了当前评估体系难以捕捉的潜在风险。
本文探讨了应用开发中可能有意或无意产生的暗黑模式对消费者自主权的损害,并提出了通过优化选择架构和透明设计原则来规避法律风险、建立用户信任的策略。
本文提出了一种针对经验性抗生素处方中确定性、基于规则的临床决策支持系统的治理与评估框架,该框架将治理作为核心设计要素,通过明确界定作用范围、强制中止条件及确定性约束,并采用基于合成病例的行为一致性验证方法,以确保系统在高风险场景下的透明度、可审计性及保守决策行为。
本文提出并评估了五种旨在减少工业大语言模型幻觉的提示工程策略,通过“增强数据注册”等方法在基准测试中显著提升了输出的一致性与事实准确性,从而在不修改模型权重的情况下推动工业流程向认知稳定性迈进。
本文介绍了名为"Dance2Hesitate"的开源多模态数据集,该数据集通过舞蹈家的动作捕捉与机器人的力觉示教,收集了涵盖不同犹豫程度的人机协作运动轨迹,旨在解决机器人犹豫动作设计难以泛化及理解的问题。
该研究利用 OpenRobotRehab 1.0 数据集,通过分析健康与中风后用户在六维等距游戏任务中的力输出、肌电活动及游戏表现,揭示了界面设计对行为的影响,验证了基于隐马尔可夫模型的肌电分类法在区分病理与正常运动策略方面的有效性,并为设计能促进多样化用户群体健康运动策略的自适应末端执行器康复机器人提供了指导。
该论文提出了 DUCTILE 框架,一种由大语言模型代理进行自适应编排、工程师负责监督的混合自动化方法,旨在解决航空航天产品开发生态中因工具接口和数据格式频繁变更而导致传统工程分析自动化失效的问题,并验证了其在处理输入偏差时仍能生成符合规范且准确结果的有效性。
本文介绍了一种基于人机交互设计、利用大语言模型函数调用能力与交互式地图相结合的自然语言对话系统,旨在通过实时查询澳大利亚博物馆约 170 万条数字化标本记录,解决大规模自然历史馆藏数据因规模复杂而难以被公众访问和理解的难题。
该研究利用过渡网络分析(TNA)处理 40 名临床医生在 VR 心脏骤停模拟中的眼动数据,揭示了不同角色(如气道管理、心肺复苏、除颤和团队领导)的视觉注意力如何随临床需求动态调整,从而为理解团队情境意识和优化急救培训提供了新的分析视角。