A Dataset for Probing Translationese Preferences in English-to-Swedish Translation

该论文发布了首个英语到瑞典语的“翻译腔”偏好数据集,通过对比翻译腔句子与地道表达,揭示了语言模型倾向于保留源语言痕迹的偏好,并为提升非英语输出的自然度提供了基准资源。

Jenny Kunz, Anja Jarochenko, Marcel Bollmann

发布于 2026-03-10
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文就像是在给翻译机器做一场“体检”,专门检查它们有没有患上一种叫"翻译腔"(Translationese)的“职业病”。

想象一下,你请了一位外国厨师(翻译模型)来做饭。虽然他能做出能吃的菜,但味道总是怪怪的——比如他做“红烧肉”时,非要按做“牛排”的逻辑来切肉,或者把“加油”翻译成“添加汽油”。这就是翻译腔:机器翻译出来的文字虽然语法没错,但读起来生硬、不自然,充满了源语言(英语)的影子,不像母语者(瑞典语)平时说话那样地道。

以下是这篇论文的核心内容,用大白话和比喻来解释:

1. 他们造了一个“找茬”题库

作者们(来自瑞典林雪平大学)觉得,现在的翻译模型虽然变聪明了,但依然喜欢“照本宣科”。为了测试它们,他们做了一个瑞典语数据集

  • 这个数据集像什么?就像是一个“找不同”游戏。
    • 题目 A(翻译腔版):机器翻译出来的句子,读起来像外国人写的瑞典语(比如直译了英语的“一件傻事”,瑞典语习惯说“有点傻”)。
    • 题目 B(地道版):人类专家写的地道瑞典语。
  • 任务:让各种大小的 AI 模型(从小的到大的)来选,它更喜欢哪一个?它觉得哪个读起来更顺?

2. 实验结果:AI 是个“死脑筋”

实验结果有点让人哭笑不得:

  • AI 偏爱“翻译腔”:大多数时候,AI 模型竟然觉得那个生硬的、机器味很浓的句子(题目 A)更好!它们似乎被源语言(英语)“洗脑”了,只要看到英语原文,就忍不住想照搬结构。
  • 关掉“提示”会好点:如果只给 AI 看瑞典语句子,不让它看英语原文,它选对(选地道版)的概率会高一些。这说明英语原文就像一根“拐杖”,AI 太依赖这根拐杖,反而走不出自己的路
  • 上下文是双刃剑:给 AI 多提供一点前文背景(比如对话的前几句),有时候能帮它理解语境,选对地道句子;但有时候,背景越多,它反而越执着于字面翻译,变得更“死板”。

3. 为什么 AI 会犯这种错?(病根分析)

论文里把 AI 的错误分成了几类,就像医生给病人分类症状:

  • 直译病(DIR):比如英语说 "It's got good bones"(这房子结构好),AI 直译成“它有好的骨头”,而人类会说“地基很稳”。AI 太字面化了。
  • 词汇感冒(PR):用词太正式或太随意。比如把“礼物”(gift)翻译成瑞典语里那种很正式的“赠礼”,但在日常对话里应该用更亲切的“小礼物”。
  • 习语失语(ID):遇到成语或俗语就懵。比如 "I had an old bone to pick with you"(我有话要跟你算账),AI 可能真的去翻译“骨头”和“挑选”,完全丢了原意。
  • 漏字/多字:有时候少说了词,有时候废话连篇。

4. 大模型就一定好吗?

有趣的是,模型越大,并不总是越好

  • 在对比“人类翻译”和“旧式机器翻译”时,大模型表现稍好。
  • 但在对比“人类翻译”和“最新的大模型(GPT-5)”时,大模型反而更喜欢那个最新的大模型生成的翻译,哪怕那个翻译也有点生硬。这说明,现在的 AI 们可能都在互相模仿,形成了一个“翻译腔的回音室”。

5. 这篇论文有什么用?

这就好比给翻译界发了一张“体检报告”和一套“康复训练题”。

  • 资源公开:他们把这个“找茬题库”免费公开了,让全世界的研究者都能拿来训练 AI。
  • 目标:希望未来的 AI 不仅能“翻译对”,还能“翻译得像人”。让 AI 写出来的瑞典语,不再像是一个拿着字典的外国人在说话,而是像瑞典本地人一样自然、生动。

总结一下
这篇论文告诉我们,现在的 AI 翻译虽然厉害,但还像个只会死记硬背的学生,太依赖课本(源语言),缺乏灵活变通的能力。作者们通过制造这个“找茬”数据集,希望能帮 AI 改掉“翻译腔”的毛病,让它真正学会像母语者一样思考和表达。