Identifying the Geographic Foci of US Local News

该研究提出了一种新颖的地理焦点模型,通过结合人工标注、大语言模型消除地理实体歧义以及构建空间语义特征,实现了对美国地方新闻文章地理焦点的高精度自动识别(F1 分数达 0.86),从而助力研究者深入分析地方媒体叙事及其向全国性叙事的转变。

Gangani Ariyarathne, Isuru Ariyarathne, Greatness Emmanuel-King, Kate Lawal, Alexander C. Nwala

发布于 2026-03-03
📖 1 分钟阅读☕ 轻松阅读

Each language version is independently generated for its own context, not a direct translation.

这篇论文讲述了一个关于**“如何教电脑读懂美国本地新闻到底在讲哪里”**的故事。

想象一下,你手里有一堆来自美国各地的报纸。有些报纸在讲“威廉斯堡的学校董事会选举”,有些在讲“密尔沃基的铅污染”,还有些在讲“孟加拉国的飞机坠毁”。

现在的挑战是:随着经济压力变大,很多本地新闻机构被迫开始报道全国甚至全球的大新闻,导致“本地味”变淡了。研究者想知道:这些新闻到底是在关心自家门口的事,还是在讲远方的故事?

为了解决这个问题,作者团队开发了一个叫 NLGF 的“智能新闻侦探”。下面我用几个简单的比喻来解释他们是怎么做的:

1. 遇到的难题:地名是个“捣蛋鬼”

在新闻里,地名经常让人晕头转向。比如看到"Paris"(巴黎),电脑会困惑:是讲法国那个浪漫的巴黎,还是美国德克萨斯州那个叫巴黎的小镇?

  • 以前的方法:就像用一本旧地图册去查,或者用死板的规则,经常查错。
  • 作者的新招:他们请来了大型语言模型(LLM),也就是像现在的 AI 聊天机器人那样聪明的“超级图书管理员”。
    • 比喻:以前的工具像是一个只会查字典的小学生,看到"Paris"就随便指一个;而 AI 像是一个读过所有新闻的老记者,它能结合上下文(比如文章是德克萨斯州报纸发的),瞬间判断出“哦,这里肯定是讲德州的巴黎,不是法国的”。
    • 结果:AI 在分辨这些“捣蛋鬼”地名时,比所有传统工具都准得多。

2. 核心任务:给新闻贴“地理标签”

一旦搞清楚了地名指哪里,下一步就是给整篇文章贴标签。作者把新闻分成了五个等级,就像给新闻画“同心圆”:

  • 本地 (Local):只讲自家社区的事(比如:某某县修路)。
  • 州级 (State):讲整个州的事(比如:加州全州的选举)。
  • 全国 (National):讲美国全国的事(比如:联邦政策)。
  • 国际 (International):讲美国以外的事(比如:俄乌冲突)。
  • 无 (None):没有具体地点(比如:科学发现)。

3. 侦探的“独门秘籍”:不仅看地名,还要看“戏份”

光知道地名在哪还不够,还得知道它在文章里有多重要。作者设计了一套“评分系统”,就像导演在选角:

  • 看位置:地名是出现在标题里(C 位出道),还是藏在文章最后(跑龙套)?出现在标题的地名通常更重要。
  • 看频率:地名在文章里被提到了多少次?
  • 看身份:这个地名是“主角”(政治实体,如城市、国家)还是“配角”(普通地点,如公园)?

比喻:这就好比你在看一场戏。如果“纽约”这个词在标题里大喊大叫,还在开头反复出现,那这出戏肯定是在讲纽约;如果“纽约”只在结尾被提了一句,那可能只是背景板。NLGF 模型就是那个最懂戏份分配的导演,它能精准判断哪出戏的主角是谁。

4. 最终成果:比“人工”和"AI"都强

研究者训练了一个模型,让它学会根据这些线索来分类新闻。

  • 成绩:这个模型的准确率(F1 分数)达到了 0.86(满分 1 分)。
  • 对比
    • 它比直接用 AI 聊天机器人(GPT-4o)猜要准得多。
    • 也比以前那种只数地名出现次数的老方法(Cliff-Clavin)强很多。
    • 为什么? 因为老方法太死板,AI 聊天机器人虽然聪明但有时候会“飘”,而 NLGF 是**“聪明的 AI 地名翻译” + “懂戏份的导演规则”**的完美结合。

5. 这有什么用?

这个工具就像一个**“新闻显微镜”**。

  • 它可以帮研究人员看清:现在的本地新闻是不是越来越爱讲“国家大事”,而忽略了“家长里短”?
  • 它可以帮媒体人发现:我们是不是忽略了某些社区的声音?
  • 它甚至可以帮助未来的 AI 更好地理解新闻,让新闻推送更精准。

总结一下:
这就好比给美国新闻界装了一个**“地理导航仪”**。它不仅能听懂新闻里提到的地名是哪里,还能判断这篇新闻的“重心”是在家门口,还是在千里之外。这让我们能更清楚地看到,本地新闻到底还在不在关心老百姓的柴米油盐。

在收件箱中获取类似论文

根据您的兴趣定制的每日或每周摘要。Gist或技术摘要,使用您的语言。

试用 Digest →