The Differential Effects of Agreeableness and Extraversion on Older Adults' Perceptions of Conversational AI Explanations in Assistive Settings

该研究通过混合因子实验发现,在老年辅助场景中,大语言模型语音助手的宜人性人格显著影响其共情与喜爱度感知(高宜人性提升共情,低宜人性降低喜爱度),而外向性影响较小,且环境实时解释在紧急情境下优于对话历史解释,同时用户与代理的人格一致性(尤其是高宜人性用户)会加剧对低宜人性代理的负面评价。

Niharika Mathur, Hasibur Rahman, Smit Desai

发布于 Tue, 10 Ma
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在探讨一个非常有趣的问题:当家里的智能语音助手(比如未来的“小爱同学”或"Siri"升级版)变老、变聪明,甚至有了“性格”时,老年人到底喜欢什么样的性格?而且,当它解释“为什么这么做”时,什么样的解释方式最让人放心?

研究人员找来了 140 位老年人,让他们看一系列关于一位叫“亚瑟”的老爷爷和他家里新来的智能助手“罗宾”(Robin)互动的故事。他们给“罗宾”设定了不同的性格,并让它用不同的方式解释自己的行为,看看亚瑟(以及观看故事的老年人)会怎么想。

为了让你更容易理解,我们可以把这位智能助手想象成一位新搬来的管家

1. 核心实验:给管家设定不同的“人设”

研究人员主要测试了两种性格特质(基于心理学著名的“大五人格”理论):

  • 随和度 (Agreeableness): 就像管家是“温柔体贴的邻家阿姨”还是“冷冰冰的办事员”。
    • 高随和: 说话客气、温暖、充满关怀(例如:“亚瑟,您看,厨房的垃圾桶满了,趁您现在在附近,要不要顺手倒一下呢?”)。
    • 低随和: 说话直接、甚至有点生硬(例如:“垃圾桶满了,你还没倒,今天不弄明天又得堆着。”)。
  • 外向度 (Extraversion): 就像管家是“话痨的社交达人”还是“沉默寡言的实干家”。
    • 高外向: 热情洋溢、话多、喜欢用感叹号(例如:“太棒了!垃圾桶满了,咱们一起动手, teamwork makes the dream work!")。
    • 低外向: 简洁、直接、只说重点(例如:“垃圾桶满了,传感器显示需要清理。”)。

2. 核心发现:性格与解释的“魔法组合”

研究结果非常反直觉,也很有意思,我们可以用三个比喻来总结:

比喻一:性格决定“温度”,解释决定“硬度”

研究发现,性格主要影响老年人觉得这个管家“暖不暖”,而解释的方式主要影响他们觉得管家“聪不聪明”。

  • 随和度(性格): 如果管家太不随和(说话太冲),老年人会非常讨厌它,觉得它没礼貌、不可爱。但如果管家很随和,大家会觉得它很有同理心,像家人一样。
    • 关键点: 无论管家多聪明,如果它说话像教导主任一样严厉,老年人就不喜欢它。
  • 智力感(能力): 有趣的是,管家的性格(是温柔还是冷淡)完全不影响老年人觉得它聪不聪明。老年人判断管家是否聪明,只看它给出的理由靠不靠谱

比喻二:解释的“两种语言”

管家解释“为什么提醒我”时,有两种方式:

  1. 翻旧账型(对话历史): “亚瑟,您上周二说过这周要倒垃圾,所以我提醒您。”(基于过去的对话)。
  2. 看现场型(环境数据): “亚瑟,传感器检测到垃圾桶满了,而且您现在就在厨房。”(基于实时数据)。

研究发现:

  • 日常琐事(如提醒吃药、倒垃圾)中,这两种解释方式差别不大,大家都挺满意。
  • 但在紧急情况(如检测到火灾、跌倒)中,“看现场型”解释完胜!老年人觉得:“既然传感器都报警了,那肯定是真的,快跑!”这时候,翻旧账(“您以前说过要注意安全”)就显得太慢、太不靠谱了。

比喻三:沉默的实干家 + 铁证如山 = 最让人信任

这是最精彩的发现!

  • 通常我们认为,热情外向的管家更让人信任。但在这个研究里,最让人信任的组合竟然是:一个话不多、性格内向(低外向)的管家 + 基于实时传感器数据的硬核解释
  • 为什么? 想象一下,家里着火了,你希望管家是那种咋咋呼呼喊“天哪着火啦太可怕了”的人,还是那种冷静地说“烟雾传感器检测到火情,请立即撤离”的人?显然是后者。
  • 当管家性格比较冷淡、话少时,如果它能给出非常扎实、基于事实的证据(比如传感器数据),老年人反而会觉得它特别专业、特别值得信任。这种“话少但靠谱”的组合,在紧急情况下最能给人安全感。

3. 老年人的“性格匹配”小秘密

研究还发现了一个有趣的“性格相斥”现象:

  • 如果老年人自己性格比较随和(喜欢温和的人),他们会对那个说话生硬、不随和的管家特别反感,甚至觉得它不可信。
  • 这就像如果你是个温柔的人,突然遇到一个说话带刺的人,你会特别不舒服。但如果对方也是温和的,大家就相安无事。

4. 给未来的设计建议(简单版)

基于这些发现,未来的智能助手应该这样设计:

  1. 想让人喜欢?先学会“温柔”: 想要老年人觉得助手亲切、有同理心,必须把“随和度”调高。说话要客气,要有温度。
  2. 想让人信任?看情况给解释:
    • 如果是日常小事,怎么解释都行,甚至翻翻旧账(“您上次说……")也挺亲切。
    • 如果是紧急大事(安全警报),千万别废话,直接甩出实时证据(“传感器显示……")。这时候,性格越冷静、解释越硬核,越让人放心。
  3. 不要试图用性格掩盖能力: 一个性格再好的助手,如果解释不清为什么报警,大家也不会信它;一个解释再清楚的助手,如果说话太冲,大家也不会喜欢它。“温暖”和“靠谱”是两回事,需要分开设计。

总结

这篇论文告诉我们,给老年人设计 AI 助手,不能只追求“像人”或者“像机器”。

  • 要像温暖的家人一样说话(高随和度),这样大家才愿意跟它相处。
  • 但在关键时刻,要像冷静的专家一样拿出证据(环境数据解释),这样大家才敢把命交给它。

最完美的管家,可能是一个说话温柔但关键时刻话少、只讲事实的人。