Just-In-Time Objectives: A General Approach for Specialized AI Interactions
该论文提出了一种“即时目标”(Just-In-Time Objectives)方法,通过被动观察用户行为实时推断并优化其特定目标,从而引导大语言模型动态生成高度个性化的专用工具与高质量交互响应,显著优于传统通用模型。
255 篇论文
该论文提出了一种“即时目标”(Just-In-Time Objectives)方法,通过被动观察用户行为实时推断并优化其特定目标,从而引导大语言模型动态生成高度个性化的专用工具与高质量交互响应,显著优于传统通用模型。
该论文提出并通过实验验证了四种增强现实视野指示器(分为以机器人为中心的 egocentric 和以任务为中心的 allocentric 两类),旨在纠正人类对机器人视野的错误认知模型,其中将指示器直接置于任务空间(allocentric)的方法在协作任务中显著提高了人类对机器人视野判断的准确性。
该论文提出了一种将动态风险场与随时间变化的凸可行空间生成相结合的新型轨迹规划框架,利用约束迭代线性二次型调节器(iLQR)算法在复杂动态交通场景(如换道和环岛)中实现了兼顾安全性、效率与舒适性的自主规划。
本文提出了 XR-DT 框架,该框架结合扩展现实(XR)数字孪生技术与基于注意力机制的轨迹预测模型,通过新型的人类感知模型预测路径积分(HA-MPPI)控制器,实现了人机共享空间中安全、高效且可解释的机器人运动规划。
这项基于 737 名参与者的研究通过对比实验发现,在“氛围编程”(vibe coding)协作中,人类主导指令而 AI 负责评估的混合模式表现最佳,且人类提供的高层指令能有效避免 AI 主导指令导致的性能崩溃,凸显了人类指导在构建未来人机协作社会中的关键作用。
本文提出了一种面向数字人文学科的 OCR 校正溯源框架,通过记录文本修正的谱系信息,揭示了校正路径对下游实体抽取及学术解读的显著影响,并主张将溯源数据作为支持可重复性与不确定性感知的核心分析层。
该论文通过两项研究揭示了当前 AI 代理在协同创作中缺乏对并发用户动作的实时理解能力,进而提出了能解析协作意图并实时自适应的 CLEO 系统,并通过决策模型阐明了人类与代理在委托、指导及并发协作等模式间的动态切换机制。
本文概述了将二维与三维交互式可视化无缝集成于扩展现实(XR)空间的优势,并通过三个案例研究展示了该方法如何通过结合传统显示与三维虚拟环境来提升复杂数据及 AI 分析结果的分析效率。
该论文通过对客服聊天bot的回顾性日记研究及对八位AI专家的半结构化访谈,运用五轮主题分析法提炼出AI治理与人类权威、人机循环迭代优化、AI系统生命周期与运营约束、以及人机团队协作协调四大主题,旨在为后续的人机回环(HITL)框架设计与验证提供实证依据。
本文介绍了名为"Companion"的艺术装置,它通过结合绘图机器人与大语言模型,利用上下文学习和实时工具调用实现人机语音与绘画的双向互动,将机器人从被动执行者转变为能推动共同视觉叙事的创造性伙伴,并经专家评估证实了其作品具备独特的审美价值与专业展览潜力。
该研究通过提出生物特征注册与可重构通信通道概念,绘制了生物特征技术赋能个性化辅助沟通系统的路线图,并结合手势与手语识别案例,指出当前人工智能技术在精度上尚无法满足实际需求,进而提出了改进建议。
本文提出了一种结合非专家用户共创与专家评估的两阶段方法论,通过挖掘用户直觉隐喻并融合专家对工效学及区分度的考量,成功构建了一套旨在解决“米达斯触”问题并提升自然性的眼动手势交互体系。
本文通过一项涉及 20 名资深研究者的探索性设计研究,揭示了系统文献综述中存在的认知负荷与工具碎片化等挑战,并据此提出了名为 ARC 的设计原型,该原型通过多数据库集成、透明迭代搜索及可验证的 AI 辅助筛选,有效帮助研究者从繁琐的行政工作中解放出来,转向更具战略性的知识探索与负责任的人工智能辅助决策。
该论文提出了国际工具调用(ITC)数据集,这是一个包含 40 个国家 3571 个真实 API 和 17540 个多语言任务的大规模基准,旨在解决现有工具调用研究在真实性、可复现性及文化多样性方面的不足,并显著提升了大语言模型在跨语言、跨领域及复杂国际场景下的工具调用性能。
这篇范围综述通过分析 2015 至 2025 年的实证研究,系统梳理了痴呆症护理中可穿戴与环境感知技术的应用现状,并提出了涵盖以人为本设计、个性化方案、工作流整合、隐私保护及伦理可扩展性等五大关键实施原则,以指导未来开发能增强照护自动化与患者自主性的感知系统。
CoEditor++ 是一种无需训练的认知结构化框架,通过“编辑什么”和“如何编辑”的双阶段推理及自选择机制,在无需微调的情况下实现了超越现有开源及闭源模型的指令驱动图像编辑性能,同时显著提升了视觉一致性和任务可解释性。
本文介绍了名为 Aletheia 的新型浏览器扩展,它利用检索增强生成(RAG)和大语言模型(LLM)技术,不仅通过实验证明在虚假新闻检测性能上优于现有基线,还通过包含讨论中心和事实核查推送的交互功能,在 250 名参与者的用户研究中验证了其高可用性与感知有效性,从而提供了一种透明且以用户为中心的解决方案来应对虚假新闻传播问题。
本文介绍了 RFM-HRI 多模态数据集,该数据集通过在医院和实验室环境中对 41 名参与者进行Wizard-of-Oz 研究,系统记录了医疗机器人在物品检索任务中发生四类交互失败时用户的言语与非言语反应及恢复偏好,揭示了失败对情感效价和感知控制的负面影响,并为安全关键场景下的故障检测与恢复策略提供了基础。
该论文指出当前生成式 AI 在应对心理健康危机时过度侧重风险规避而拒绝提供实质性支持,进而提出应借鉴社区互助模式,通过赋能型设计原则将 AI 重塑为能够缓解危机并引导用户寻求专业帮助的“支持性桥梁”,以在风险管控与用户赋能之间取得更好平衡。
该研究通过大规模扰动实验发现,大型语言模型的道德判断极易受叙事视角、说服性提示及任务协议形式的影响,表明其道德评估结果更多取决于呈现方式而非道德实质,从而引发了关于可复现性与公平性的严重担忧。