SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

本文提出了名为 SpHOR 的开放集识别方法,通过正交标签嵌入、球面约束以及将 Mixup 和标签平滑直接融入表示学习阶段,显式优化特征空间以有效区分未知类别,并在多个基准测试中取得了最先进的性能。

Nadarasar Bahavan, Sachith Seneviratne, Saman Halgamuge

发布于 2026-02-24
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文介绍了一种名为 SpHOR 的新方法,旨在解决人工智能(特别是深度学习)在现实世界中面临的一个大难题:如何识别“没见过”的东西

为了让你轻松理解,我们可以把人工智能想象成一个正在学习识别水果的超级厨师

1. 核心问题:厨师的“熟悉陷阱”

想象一下,这位厨师(AI 模型)在训练时只见过苹果、香蕉和橙子

  • 闭集识别(传统方法):厨师认为世界上只有这三种水果。如果端上来一个(未知类别),厨师会硬着头皮说:“这肯定是个苹果!”或者“这是个橙子!”。他不敢承认自己没见过,因为他的训练规则就是“必须选一个”。
  • 开集识别(OSR 的目标):我们希望厨师能诚实地说:“等等,这个梨我从来没见过,它不属于苹果、香蕉或橙子中的任何一种,请把它标记为‘未知’。”

难点在哪里?
论文指出,很多未知的水果(比如梨)长得和已知的水果(比如青苹果)非常像。如果厨师只关注“它们都是圆形的、有皮的”这种共同特征,他就很容易把梨误认成青苹果。这就是论文提到的**“熟悉陷阱”(Familiarity Trap)**:因为太像了,所以自信地认错了。

2. SpHOR 的解决方案:重新设计“大脑”的存储方式

以前的 AI 方法通常是让厨师在“认识水果”和“拒绝陌生水果”这两件事上一起训练,结果往往是顾此失彼。

SpHOR 提出了一种**“两步走”的策略,就像先教厨师如何整理货架**,再教他如何贴标签

第一步:整理货架(特征学习阶段)

SpHOR 不急着让厨师认水果,而是先教他如何把水果在脑海里摆放得井井有条。它用了三个“魔法”:

  1. 正交标签(Orthogonal Label Embeddings)—— 让每个类别住进独立的房间

    • 比喻:想象一个巨大的球形仓库。以前的方法可能让苹果和梨的货架挤在一起。SpHOR 强制规定:苹果必须住在“东半球”,香蕉住“西半球”,橙子住“南半球”。
    • 作用:通过数学上的“正交”(互相垂直),确保每个类别的特征空间是完全分开的。这样,如果一个新水果(梨)出现,它既不像苹果也不像香蕉,就会落在这些“房间”之外的空地上,很容易被识别出来。
  2. 球形约束(Spherical Constraint)—— 把世界变成地球仪

    • 比喻:传统的 AI 把特征放在一个无限延伸的平面上,东西可以无限远。SpHOR 把特征强行投影到一个球体表面(就像地球仪)。
    • 作用:在球体上,距离更容易计算。它利用一种叫“冯·米塞斯 - 费雪分布”的数学模型,让同类水果紧紧聚在一起(像一群游客围在景点),而不同类水果则均匀地散落在球体各处。
  3. 混合与平滑(Mixup & Label Smoothing)—— 制造“模糊”的中间地带

    • 比喻:为了训练厨师识别“未知”,SpHOR 故意在训练时把“苹果”和“香蕉”的图片混在一起,做成一张“半苹果半香蕉”的模糊图片,并告诉厨师:“这个既不完全像苹果,也不完全像香蕉,它处于中间地带。”
    • 作用:这就像给厨师打了一剂“预防针”。当他在测试时遇到一个真正的“梨”(未知类),他就能意识到:“哦,这个感觉像那个模糊的中间地带,我不该把它强行归为苹果。”这大大减少了“熟悉陷阱”。

第二步:贴标签(分类器训练阶段)

当货架整理得井井有条后,再训练一个简单的分类器。因为“房间”已经分得很清楚了,这个分类器只需要做简单的判断,就能既准确识别已知水果,又敏锐地发现那些落在“空地”上的未知水果。

3. 如何衡量效果?(两个新尺子)

为了证明这种方法真的有效,作者发明了两种新的“尺子”来测量:

  • 角度分离度(Angular Separability):测量未知水果和已知水果在“球体”上的角度差。角度越大,越容易区分。
  • 范数分离度(Norm Separability):测量未知水果的“模糊程度”(数学上的模长)。未知水果往往因为不确定,其特征向量会显得更“短”或更“散”,通过这个指标也能把它们抓出来。

4. 成果如何?

SpHOR 在多个测试中(包括识别鸟类、汽车、飞机等精细分类任务)都取得了**世界顶尖(State-of-the-art)**的成绩。

  • 特别是在那些长得非常像的精细分类任务中(比如区分不同品种的鸟),SpHOR 比以前的方法提高了约 5.1% 的准确率。
  • 它不需要昂贵的预训练,甚至从零开始训练也能表现得很强,而且计算速度很快,适合资源有限的设备。

总结

SpHOR 就像是一位聪明的老师,它不强迫学生死记硬背(强行分类),而是先教学生建立清晰的思维框架(正交、球形空间),并让学生练习处理模糊情况(Mixup)。

最终,当面对一个从未见过的“梨”时,这位学生(AI)不再慌张地把它认成“苹果”,而是自信地举手说:“老师,这个我还没学过,它是未知的!”

这就是 SpHOR 的核心贡献:通过重塑特征空间,让 AI 学会如何优雅地承认“我不知道”。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →