cs.HC 篇论文 | Gist.Science

Tracing Everyday AI Literacy Discussions at Scale: How Online Creative Communities Make Sense of Generative AI

该研究通过分析 12 万条 Reddit 创意社区讨论，揭示出生成式 AI 素养并非静态的理论概念，而是一种以实践技能为核心、随重大事件动态演变的有机过程，呼吁相关方据此制定更贴合社区需求的资源与政策。

Haidan Liu, Poorvi Bhatia, Nicholas Vincent, Parmit ChilanaWed, 11 Ma💻 cs

A Text-Native Interface for Generative Video Authoring

本文介绍了名为 Doki 的文本原生生成式视频创作界面，它通过让用户在单一文档中直接编写文本来定义素材、构建场景和编辑视频，从而将视频创作过程与自然的写作习惯对齐，并通过部署研究验证了其降低专业门槛、提升可访问性的潜力。

Xingyu Bruce Liu, Mira Dontcheva, Dingzeyu LiWed, 11 Ma🤖 cs.AI

From Perception to Cognition: How Latency Affects Interaction Fluency and Social Presence in VR Conferencing

该论文通过对比虚拟现实（VR）与传统视频会议，利用主观实验分析了端到端延迟如何从感知层面的交互流畅性和认知层面的社会临场感两个维度影响用户体验，并揭示了两者在不同延迟条件下的内在关联机制，从而为优化沉浸式虚拟环境系统提供了指导。

Jiarun Song, Ninghao Wan, FuZheng Yang, Weisi LinWed, 11 Ma💻 cs

Entangling Like Mycorrhizae: Mixing Realities Through Touch in "FungiSync"

本文介绍了《FungiSync》这一多人共址混合现实体验，它通过将参与者化身森林植物并让手部接触触发数字感知世界的交融，将菌根网络的共生互赖转化为一种具身化的仪式，旨在以“真菌认识论”批判技术加速时代的极端个人主义。

Botao Amber Hu, Danlin Huang, Yilan Elan Tao, Xiaobo Aaron Hu, Rem RunGu LinWed, 11 Ma💻 cs

Reading the Mood Behind Words: Integrating Prosody-Derived Emotional Context into Socially Responsive VR Agents

该论文提出了一种将语音情感识别模型推断的情绪标签作为显式上下文注入大语言模型驱动的社会化 VR 代理的交互流程，并通过用户研究证实该方法显著提升了对话质量、自然度及用户参与度，使 93.3% 的参与者更倾向于选择具备情感感知能力的代理。

SangYeop Jeong, Yeongseo Na, Seung Gyu Jeong, Jin-Woo Jeong, Seong-Eun KimWed, 11 Ma🤖 cs.AI

PixelConfig: Longitudinal Measurement and Reverse-Engineering of Meta Pixel Configurations

该论文提出了名为 PixelConfig 的差分分析框架，通过逆向工程揭示了 Meta Pixel 在健康类网站等场景中默认启用高比例的活动与身份追踪功能，且即便启用了限制追踪的配置，其实际保护效果也极为有限。

Abdullah Ghani (Lahore University of Management Sciences), Yash Vekaria (University of California, Davis), Zubair Shafiq (University of California, Davis)Wed, 11 Ma💻 cs

Dynamic Multimodal Expression Generation for LLM-Driven Pedagogical Agents: From User Experience Perspective

该研究提出了一种由大语言模型驱动的动态多模态表达生成方法，通过构建语义敏感提示实现教学指令与语音手势的协同，显著提升了虚拟现实中教学代理的拟人感、社会临场感及学习者的参与度与学习效果。

Ninghao Wan, Jiarun Song, Fuzheng YangWed, 11 Ma💻 cs

The Richest Paradigm You're Not Using: Commercial Videogames at the Intersection of Human-Computer Interaction and Cognitive Science

该论文主张商业电子游戏是连接人机交互与认知科学的独特研究环境，通过利用游戏固有的认知需求与动机特性，结合屏幕录制、眼动追踪等最小化观测工具，为在生态效度更高的自然情境下系统研究感知、注意及执行功能提供了新的方法论框架。

Jaap Munneke, Jennifer E. CorbettWed, 11 Ma💻 cs

Prompt-Driven Color Accessibility Evaluation in Diffusion-based Image Generation Models

该论文针对扩散模型在色觉障碍（CVD）可访问性方面的不足，提出并验证了新型评估指标"CVDLoss"，揭示了现有模型难以通过提示词可靠地改善图像色觉可访问性的现状。

Xinyao Zhuang, Jose Echevarria, Kaan AksitWed, 11 Ma💻 cs

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

该研究通过引入大语言模型驱动的“视觉向导”并开展用户实验，发现盲人与低视力用户在社交虚拟环境中会根据情境将向导视为工具或伙伴，从而揭示了其作为 VR 无障碍解决方案的潜力与设计方向。

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri AzenkotWed, 11 Ma🤖 cs.AI

Challenges in Restructuring Community-based Moderation

本文通过研究维基百科“标记修订”系统的档案讨论及访谈，揭示了在重构基于社区的审核实践时，新系统即便在理论上可行或量化指标优异，仍可能因与既有社会规范冲突、平台与自治社区间复杂的互动关系以及高昂的维护与更替成本而面临重重挑战。

Chau Tran, Kejsi Take, Kaylea Champion, Benjamin Mako Hill, Rachel GreenstadtTue, 10 Ma💻 cs

Life Histories of Taboo Knowledge Artifacts

这项混合方法比较研究通过追踪维基百科中禁忌知识条目的生命周期，揭示了其如何在冲突与有限身份识别的挑战下，通过多元协作、韧性领导力和新兴治理机制得以建立并持续存在。

Kaylea Champion, Benjamin Mako HillTue, 10 Ma💻 cs

MediTools -- Medical Education Powered by LLMs

该研究介绍了名为 MediTools 的基于大语言模型的医疗教育原型应用，通过提供皮肤科病例模拟、AI 增强版 PubMed 文献分析及医疗新闻摘要等工具，旨在革新医学教育并提升临床决策能力，同时通过针对医疗从业者的调查验证了其初步效果。

Amr Alshatnawi, Remi Sampaleanu, David LiebovitzTue, 10 Ma💻 cs

Precision Proactivity: Measuring Cognitive Load in Real-World AI-Assisted Work

该研究通过引入认知负荷理论，分析了 34 位金融专业人士在利用 GPT-4o 完成复杂估值任务时的表现，发现 AI 生成内容能提升工作质量，但由模型发起的任务切换等引发的外在认知负荷对绩效的负面影响最大，且这种负面影响会随经验不足而加剧。

Brandon Lepine, Juho Kim, Pamela Mishkin, Matthew BeaneTue, 10 Ma💻 cs

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

本文介绍了名为"KrishokBondhu"的语音驱动农业咨询系统，该系统利用检索增强生成（RAG）技术结合 Bengali 语音交互，为孟加拉国农民提供实时、专业的农业指导，并在试点评估中显著提升了回答质量与上下文丰富度。

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

本文提出了 CompanionCast 框架，通过整合多模态事件检测、滚动上下文缓存和空间音频等技术，将多个专用 AI 智能体编排为社交协作者，从而在共享体验（如足球观赛）中显著增强用户的社交临场感与情感共鸣。

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Not all Chess960 positions are equally complex

该研究通过分析所有 960 种国际象棋变体开局，揭示了战略复杂性和决策不对称性在不同布局间存在显著差异，并指出经典开局并非平衡或复杂度的极值，而只是广泛统计分布中的普通一种配置。

Marc BarthelemyTue, 10 Ma🔬 physics

Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

该研究提出了名为 SIM-VAIL 的审计框架，通过模拟不同精神健康脆弱性的用户与 AI 聊天机器人的对话，揭示了“脆弱性放大交互循环”（VAILs）这一系统性失效模式，即看似支持性的回复在特定情境下会随时间推移加剧用户风险，从而强调了针对多维度风险进行量化评估的必要性。

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M NourTue, 10 Ma💻 cs

XInsight: Integrative Stage-Consistent Psychological Counseling Support Agents for Digital Well-Being

本文提出了 XInsight，一个受心理咨询启发的多智能体框架，通过模拟“探索 - 洞察 - 行动”范式及“推理 - 干预 - 反思”循环，将开放式网络对话转化为标准化的心理治疗记录，并引入 XInsight-Bench 评估基准，从而为数字健康应用提供了更具可解释性、连贯性和临床一致性的心理支持解决方案。

Fei Wang, Jiangnan Yang, Junjie Chen, Yuxin Liu, Kun Li, Yanyan Wei, Dan Guo, Meng WangTue, 10 Ma🤖 cs.LG

What Does AI Do for Cultural Interpretation? A Randomized Experiment on Close Reading Poems with Exposure to AI Interpretation

该研究通过一项针对 400 名参与者的随机实验发现，在诗歌细读中，单一 AI 解读能同时提升表现与愉悦感，而多重解读仅改善表现，且过度依赖 AI 虽能提高任务表现却会削弱阅读乐趣，从而表明在文化解读中"AI 辅助少即是多”。

Jiayin Zhi, Hoyt Long, Richard Jean So, Mina LeeTue, 10 Ma💻 cs