ExposureEngine: Oriented Logo Detection and Sponsor Visibility Analytics in Sports Broadcasts

本文提出了 ExposureEngine,这是一个面向体育转播的端到端系统,通过预测旋转边界框(OBB)实现精准的品牌曝光检测,并结合自然语言智能体层生成可审计的赞助可视性分析报表。

Mehdi Houshmand Sarkhoosh, Frøy Øye, Henrik Nestor Sørlie, Nam Hoang Vu, Dag Johansen, Cise Midoglu, Tomas Kupka, Pål Halvorsen

发布于 2026-03-06
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇文章介绍了一个名为 ExposureEngine(曝光引擎)的聪明系统,它的主要任务是在足球比赛的电视转播中,自动、精准地计算赞助商广告牌的“曝光量”

为了让你更容易理解,我们可以把整个过程想象成**“给电视里的广告拍一张完美的全身照”**。

1. 以前的痛点:笨拙的“相框”

在以前,要统计广告看了多少次、看了多久,要么靠人眼盯着看(累且慢),要么靠电脑自动识别。

  • 旧方法的问题:以前的电脑识别系统就像是一个只会画正方形相框的笨拙画家。
    • 想象一下,电视里一个广告牌因为摄像机角度倾斜,或者印在弯曲的球衣上,看起来是斜的。
    • 旧系统为了把这个斜着的广告牌框住,不得不画一个巨大的、正正方方的框。结果,这个框里不仅包含了广告牌,还塞进了很多多余的背景(比如草地、天空)
    • 后果:这就像你给一个人拍照,却把旁边的一大片空地也拍进去了,导致你误以为这个人比实际大很多,或者算错了他在画面里占了多少比例。这会让广告主的钱算不准。

2. 新系统(ExposureEngine)的绝招:灵活的“紧身衣”

这个新系统引入了一个核心概念:OBB(定向边界框)

  • 新方法的比喻:现在的系统不再穿“正方形盔甲”,而是穿上了一件智能的“紧身衣”
    • 不管广告牌是斜的、弯的,还是被风吹得扭曲了,这个“紧身衣”都能紧紧贴合广告牌的轮廓,只包住广告牌本身,不浪费任何一点背景空间
    • 这就好比裁缝量体裁衣,而不是用一块大布随便盖住。这样算出来的“曝光面积”就精准多了。

3. 它是如何学习的?(特训营)

为了让这个“紧身衣”系统学会识别各种各样的广告牌,作者们做了一个非常特别的训练数据集

  • 素材来源:他们收集了 2024 年瑞典顶级足球联赛的 97 个精彩片段。
  • 工作量:人工标注了 1,103 张关键帧,里面包含了 670 种不同的赞助商 Logo。
  • 关键点:这是世界上第一个专门针对足球转播、且标注了**“倾斜角度”**的公开数据集。就像给教练准备了一本专门教“如何识别斜着跑的人”的教科书。

4. 系统的“大脑”和“嘴巴”

这个系统不仅仅会“看”,还会“思考”和“说话”:

  • 超级大脑(AI 模型):它基于最新的 YOLOv11 模型,经过特殊训练,能同时处理 670 种不同的 Logo,哪怕它们很小、很模糊或者被挡住了一部分。
  • 智能助手(AI 代理层):这是最酷的部分。你不需要去查复杂的表格,直接像跟朋友聊天一样问它:
    • “帮我找出下半场阿迪达斯出现最频繁的那 5 秒钟,并生成一个短视频发给我。”
    • “总结一下耐克在整个比赛中的曝光时长。”
    • 系统里的“智能代理”会自动听懂你的话,去数据里找答案,生成报告,甚至帮你剪辑视频。

5. 最终成果:精准的商业价值

  • 算得准:因为去掉了多余的背景,系统能精确计算出广告牌在屏幕上到底占了多大比例,持续了多久。
  • 跑得快:在显卡加速下,它能以每秒 20 帧的速度处理视频,几乎可以实时出结果。
  • 用得上:对于电视台和广告主来说,这意味着他们不再需要猜广告值多少钱,而是有了一份**“几何级精准”的账单**。

总结

简单来说,ExposureEngine 就像是一个拥有“透视眼”和“智能裁缝”技能的超级会计。它不再用粗糙的方框去估算广告,而是用精准的“紧身衣”去贴合每一个 Logo,再配上一个能听懂人话的 AI 助手,把枯燥的数据变成了直观、可操作的商业洞察。

这让体育转播中的广告价值评估,从“凭感觉猜”变成了“科学计算”。