NasoVoce: A Nose-Mounted Low-Audibility Speech Interface for Always-Available Speech Interaction
NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面,它通过融合麦克风与振动传感器的互补信号,在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。
255 篇论文
NasoVoce 是一种安装在眼镜鼻托处的新型语音交互界面,它通过融合麦克风与振动传感器的互补信号,在嘈杂环境中实现了对低音量及耳语的高鲁棒性、隐蔽且持续的语音识别。
该研究通过混合方法揭示了在 AI 辅助写作中,用户因过度依赖“先评估建议后构思”的“反应式写作”模式,在不知不觉中被 AI 引导并改变观点,却误以为自己仍完全掌控写作过程。
该研究通过设计名为 AnimaStand 的动画手机支架,将智能手机转化为主动的具身协调者,在四人小组讨论中有效重燃了成员参与度,并提升了群体动态、任务表现及人际关系。
本文提出了 MoXaRt,一种利用视听线索实时分离复杂 XR 环境中多声源的系统,通过级联架构将语音理解能力提升了 36.2% 并显著降低了用户的认知负荷。
本文提出了 G-STAR,一种将时间感知说话人追踪模块与语音大语言模型转录骨干相结合的端到端系统,旨在解决长篇幅、多说话人重叠语音场景下,在保持会议级说话人身份一致性的同时生成带时间戳和说话人标签的转录文本的问题。
该论文通过对海量科学文献的语料库研究,揭示了词级图形在学术写作中应用稀少且以图标为主的现状,并提出了涵盖位置、功能与视觉表现的分类框架,旨在推动其在提升学术交流效率方面的潜力。
该论文通过大规模元评估研究了视觉语言模型作为自主计算机使用代理审计器的能力,发现尽管这些模型在准确率和置信度校准方面表现强劲,但在复杂或异构环境中仍存在性能下降及模型间判断不一致的问题,从而揭示了当前基于模型的审计方法在评估真实世界自主代理时的根本局限性。
该论文指出终端之所以成为人机协作中最有效的工具,是因为其天然具备表征兼容性、操作透明性和低门槛三大设计属性,并主张任何面向智能代理的交互模态都应刻意借鉴这些属性,而非将终端视为过时的遗留产物。
本文提出了一种平台无关的多模态数字人体建模框架,通过集成 OpenBCI Galea 头显的多源生理传感数据与基于 SuperTux 的可复现游戏交互环境,将生理信号抽象为结构化可观测对象,从而支持在无需修改架构的情况下开展符合伦理规范的 AI 驱动数字人体与无障碍交互研究。
本文是 2026 年 4 月 15 日在西班牙巴塞罗那举行的首届 CHI 研讨会"CHIdeology"的论文集,旨在通过意识形态视角梳理人机交互领域中碎片化的政治、价值观与想象。
该研究通过实验发现,人类的效能信念会作为持久认知锚点引发对 AI 的盲目乐观,且情境信息对这种偏见的影响具有不对称性,导致效能信念与实际的协作绩效之间存在显著脱节,从而挑战了单纯依赖透明度的设计思路。
该研究通过调查 25 名 K-12 教师在专业发展工作坊中使用 AI 生成评分量表的经历,发现尽管 AI 能有效提供结构清晰且详细的初稿,但教师仍强调需进行人工审核与修改以解决通用性、错位及定制化不足等问题,从而表明在确保教师控制权和工作流支持灵活定制的前提下,教师对采用此类 AI 工具持条件性接受态度。
该论文针对现有 AI 智能体开发模式与领域专家知识隐性、动态特性不匹配的问题,提出了“培育优先开发(NFD)”范式,主张通过结构化对话与“知识结晶循环”机制,将智能体从最小化脚手架逐步培育为具备领域专业能力的系统。
该论文提出了"World Mouse",一种利用语义分割和网格重建技术,通过表面法线实现物体内精确定位、并通过插值实现物体间导航的跨现实光标,旨在解决扩展现实(XR)中自然交互在精度与可达性方面的局限性,从而实现虚实环境间的无缝交互。
该论文提出了一种任务感知的协作信号层,通过将离线偏好评估转化为在线可解释的委托线索(如能力画像与协调风险提示),构建了一个支持共同验证、自适应路由及可审计问责的闭环委托协议,从而将人机协作中的委托决策从黑盒默认转变为透明、可协商且可审计的协同过程。
该论文提出了“阅读活动痕迹”(RATs)概念,将阅读重新定义为一种创造性活动,并通过 WikiRAT 等实例展示了如何通过追踪阅读轨迹来使被算法压缩的人类解释性工作可视化,从而为反思性实践和智能工具设计开辟新路径。
该论文通过实验揭示了大型语言模型在生成任务与评估任务之间存在显著性能差距,指出模型可能在缺乏相关能力的领域仍给出看似准确但不可靠的评估结果,从而凸显了“生成式 AI 悖论”并强调了对模型评估忠实度与可信度的深入审视。
该论文采用以幸存者为中心的视角,揭示了由开源换脸模型和大量“去衣”软件构成的“恶意技术生态系统”如何导致当前基于 NIST 报告等标准的 AI 治理框架在应对成人非自愿深度伪造色情内容时存在严重失效与认知缺陷。
PriorWeaver 是一款交互式可视化系统,通过迭代构建和精炼数据集的方式,帮助缺乏贝叶斯分析经验的用户更直观地表达信念,从而生成更符合其预期的统计先验分布。
该论文以唐代大明宫含元殿为例,提出并验证了名为"Pre/Absence"的虚拟现实体验,通过“在场与缺席”的辩证叙事将实体与消逝的遗产交织,证明其相较于传统纸质媒介能更有效地提升用户文化意识、激发情感共鸣并促进对遗产社会政治意义的批判性反思。