National and state-level datasets of United States forensic DNA databases 2001-2025

Este artigo apresenta uma série de dados harmonizados que documentam a infraestrutura, a composição e as políticas dos bancos de dados de DNA forense nos Estados Unidos em níveis nacional e estadual de 2001 a 2025, permitindo análises longitudinais do crescimento do sistema e das variações políticas entre as jurisdições.

Yemko Pryor, Virum Ranka, Joao Pedro Donadio, Samantha C. Muller, Jenna Wilson, Tina Lasisi

Publicado 2026-03-05
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que os bancos de dados de DNA forense dos Estados Unidos são como uma gigantesca biblioteca de segredos genéticos. Durante as últimas duas décadas, essa biblioteca cresceu de um pequeno armário para um arranha-céu, mas ninguém tinha um mapa completo, atualizado e organizado para navegar por ela.

Este artigo é exatamente esse mapa.

Aqui está uma explicação simples do que os autores fizeram, usando analogias do dia a dia:

1. O Problema: A Biblioteca Desorganizada

Imagine que o FBI (a polícia federal dos EUA) mantém um registro mensal de quantos perfis de DNA eles têm. Eles publicam esses números na internet, mas é como se eles trocassem a capa do livro e mudassem a numeração das páginas a cada ano, sem avisar.

  • O que acontecia antes: Se você quisesse saber quantos perfis existiam em 2010, você tinha que adivinhar ou pegar um "instantâneo" aleatório da internet. Se quisesse comparar com 2020, era quase impossível porque os dados não estavam alinhados.
  • A situação nos estados: Cada estado (como um livro diferente na biblioteca) tinha suas próprias regras. Alguns diziam quantos perfis tinham, outros não diziam nada. E sobre quem são essas pessoas (homens, mulheres, raças)? Essa informação estava quase invisível, escondida em gavetas trancadas.

2. A Solução: Os Três "Mapas" Criados

Os pesquisadores (uma equipe da Universidade de Michigan) decidiram organizar essa bagunça. Eles criaram três conjuntos de dados principais, que funcionam como três ferramentas diferentes para entender a biblioteca:

  • Mapa 1: A Linha do Tempo Nacional (O Filme)
    Eles foram ao "Wayback Machine" (uma máquina do tempo da internet que salva cópias de sites antigos) e recuperaram todos os relatórios mensais do FBI de 2001 até 2025.

    • Analogia: É como se eles tivessem filmado a contagem de livros dessa biblioteca todos os meses por 24 anos, criando um filme contínuo que mostra exatamente quando o banco de dados cresceu, quando parou e como mudou. Eles corrigiram erros de digitação e organizaram tudo em uma planilha limpa.
  • Mapa 2: O Panorama dos Estados (A Foto Atual)
    Eles viajaram virtualmente pelos 50 estados para ver as regras atuais.

    • Analogia: É como fazer uma foto de grupo de todos os estados. Eles anotaram: "O Estado X permite pegar DNA de quem só foi preso, mas não condenado?" ou "O Estado Y permite usar o DNA de um suspeito para encontrar um parente?" Isso mostra como as leis variam de um lugar para o outro, como se cada estado tivesse uma regra diferente para entrar no clube.
  • Mapa 3: O Retrato das Pessoas (A Demografia)
    Eles pegaram dados antigos de pedidos de liberdade de informação (FOIA) feitos por outros pesquisadores e os digitalizaram.

    • Analogia: É como pegar as fichas de cadastro antigas de sete estados e transformá-las em um formato que o computador consegue ler. Isso permite ver, por exemplo, se o banco de dados tem mais homens ou mulheres, ou a distribuição racial, embora esses dados sejam limitados a alguns estados e ao ano de 2018.

3. A Limpeza: Como eles garantiram que os dados eram bons?

Como qualquer grande projeto, havia sujeira. O FBI mudou a forma como apresentava os dados várias vezes (mudando o layout do site, mudando os nomes dos estados, etc.).

  • O trabalho de detetive: Os autores criaram "filtros" inteligentes. Se um número pulasse do nada (ex: de 100 para 10.000 perfis em um dia) e depois voltasse ao normal, o sistema marcava isso como um "erro de digitação" (talvez alguém tenha apertado um zero a mais).
  • Eles não apagaram esses erros; eles apenas colocaram um "adesivo de alerta" neles, para que quem usar os dados saiba que ali pode haver uma falha.

4. Por que isso é importante?

Antes deste trabalho, estudar a evolução da justiça criminal nos EUA era como tentar montar um quebra-cabeça com peças de caixas diferentes.
Agora, com esses dados:

  • Pesquisadores podem ver se mudanças nas leis (como permitir pegar DNA de presos antes da condenação) realmente aumentaram o número de perfis.
  • Sociólogos podem analisar se o banco de dados reflete a população real ou se tem viés racial.
  • O público tem acesso transparente a como a tecnologia de DNA está sendo usada na justiça.

Em resumo:
Os autores pegaram uma montanha de dados soltos, confusos e escondidos em sites antigos e transformaram tudo em uma enciclopédia organizada e acessível. Eles não apenas guardaram os dados, mas explicaram como chegaram lá, permitindo que qualquer pessoa, do estudante ao cientista, possa estudar a história e o presente dos bancos de DNA nos EUA sem ter que passar anos tentando decifrar códigos antigos.