Identifying the Geographic Foci of US Local News

Este artigo propõe um novo modelo baseado em aprendizado de máquina e em grandes modelos de linguagem para identificar com precisão os focos geográficos em artigos de notícias locais dos EUA, superando métodos tradicionais de desambiguação e permitindo uma melhor análise da cobertura midiática local.

Gangani Ariyarathne, Isuru Ariyarathne, Greatness Emmanuel-King, Kate Lawal, Alexander C. Nwala

Publicado 2026-03-03
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que você tem um monte de jornais locais dos Estados Unidos espalhados por toda a mesa. Alguns falam sobre a eleição do conselho escolar na sua cidade, outros sobre uma tempestade que atingiu todo o estado, e alguns até sobre uma guerra na Ásia. O problema é que, hoje em dia, muitos desses jornais locais estão tão apertados financeiramente que acabam falando mais sobre assuntos nacionais ou internacionais do que sobre o que realmente acontece no "quintal" da comunidade deles.

Os autores deste trabalho se perguntaram: "Será que esses jornais ainda estão contando as histórias do bairro?"

Para responder a isso, eles criaram um "detetive digital" chamado NLGF (News Lab Geo-Focus). Vamos explicar como ele funciona usando analogias simples:

1. O Problema: O "Paris" Confuso

Imagine que você lê uma notícia sobre "Paris". O computador, por si só, não sabe se está falando de Paris, na França (onde tem a Torre Eiffel), ou Paris, no Texas (uma cidadezinha nos EUA). Isso é chamado de ambiguidade.

  • A Solução Antiga: Eles tentaram usar ferramentas antigas de geografia, mas era como tentar achar um endereço em um mapa desenhado à mão com giz: muitas vezes erravam, especialmente com lugares menos famosos.
  • A Solução Nova (IA): Eles usaram uma Inteligência Artificial muito inteligente (chamada LLM, como o GPT-4) que funciona como um turista experiente. Se a notícia vem de um jornal de Nova York e fala sobre "Paris", a IA sabe, pelo contexto, que provavelmente é Paris, Texas, e não a França. Ela é muito melhor em resolver esses quebra-cabeças do que as ferramentas antigas.

2. O Detetive: Como o NLGF Decide o Foco

Depois que a IA resolve onde os lugares estão, o modelo NLGF precisa decidir: "Esta notícia é sobre a cidade, o estado, o país inteiro ou o mundo?"

Para fazer isso, o modelo não apenas conta quantas vezes um nome aparece (o que seria como contar quantas vezes alguém diz "pizza" em uma conversa). Ele olha para onde e como o nome é usado:

  • A Regra do Título: Se o nome da cidade está no título da notícia, é como se alguém estivesse gritando o nome dela. Isso é um sinal forte de que a história é local.
  • A Regra da Posição: Se o nome aparece logo no primeiro parágrafo, é como se fosse o protagonista do filme.
  • A Regra da Diversidade: Se a notícia fala de 10 cidades diferentes, é provável que seja uma história nacional ou internacional, não local.

O modelo combina todas essas pistas (como um detetive juntando provas) para classificar a notícia em uma de cinco caixas:

  1. Local: Sobre a cidade ou bairro.
  2. Estadual: Sobre o estado inteiro.
  3. Nacional: Sobre o país.
  4. Internacional: Sobre outros países.
  5. Nenhum: Sobre algo sem localização (como uma descoberta científica genérica).

3. O Resultado: Quem Ganhou?

Eles testaram o novo detetive (NLGF) contra dois outros "investigadores":

  • GPT-4: Uma IA poderosa, mas que às vezes se perde sem ajuda de contexto geográfico específico.
  • Cliff-Clavin: Um método antigo que basicamente conta quantas vezes um lugar é mencionado (como contar votos).

O Veredito: O NLGF venceu de lavada!

  • Ele acertou 86% das classificações corretamente.
  • O GPT-4 acertou cerca de 66%.
  • O método antigo (Cliff-Clavin) acertou apenas 37%.

A principal vantagem do NLGF é que ele entende a hierarquia. Ele sabe que se um jornal de Virginia fala sobre "Washington D.C.", isso pode ser nacional, mas se fala sobre "Williamsburg", é local. As outras ferramentas confundiam muito essas fronteiras.

Por que isso importa?

Pense no NLGF como um termômetro da democracia local.
Se ele começar a mostrar que os jornais locais estão falando cada vez mais sobre política nacional e menos sobre a merenda escolar da cidade, isso é um sinal de alerta. Significa que a comunidade pode estar perdendo informações vitais sobre o seu próprio dia a dia.

Resumo da Ópera:
Os pesquisadores criaram um sistema inteligente que usa IA para ler notícias, descobrir exatamente onde a história acontece e classificar se é algo do bairro ou do mundo. Isso ajuda a monitorar se os jornais locais ainda estão prestando o serviço que a comunidade precisa, ou se eles viraram apenas repetidores de notícias globais. E o melhor: o código desse "detetive" é gratuito e aberto para qualquer pessoa usar!

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →