National and state-level datasets of United States forensic DNA databases 2001-2025

Cet article présente une série de données harmonisées couvrant de 2001 à 2025 qui documentent l'évolution des bases de données ADN forensiques aux niveaux national et étatique aux États-Unis, incluant des statistiques mensuelles du NDIS, des métadonnées politiques et des données démographiques collectées.

Yemko Pryor, Virum Ranka, Joao Pedro Donadio, Samantha C. Muller, Jenna Wilson, Tina Lasisi

Publié 2026-03-05
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ Le Grand Inventaire des Empreintes Génétiques aux États-Unis

Imaginez que les États-Unis possèdent une immense bibliothèque secrète. Mais au lieu de livres, cette bibliothèque contient des empreintes génétiques (des profils ADN) de millions de personnes : des criminels condamnés, des personnes arrêtées, et même des échantillons trouvés sur des scènes de crime.

Ce document est comme un guide de voyage et un inventaire de cette bibliothèque, couvrant les 25 dernières années (de 2001 à 2025). Les auteurs, une équipe de chercheurs, ont décidé de ranger le chaos pour que tout le monde puisse comprendre comment cette "bibliothèque" a grandi et comment elle fonctionne.

Voici les trois grandes parties de leur travail, expliquées avec des métaphores :

1. La "Chronique du FBI" (Les données nationales) 📅

Pendant longtemps, le FBI publiait des statistiques sur son système national (le NDIS) un peu comme des photos instantanées : "Voici le nombre de profils en 2012", puis "Voici le nombre en 2021". Mais si vous vouliez voir l'évolution mois par mois, c'était impossible car les anciennes pages web disparaissaient ou changeaient de forme.

  • L'analogie : C'est comme si quelqu'un avait pris des milliers de photos d'un arbre qui pousse, mais avait jeté les photos intermédiaires.
  • Ce qu'ils ont fait : Les chercheurs ont utilisé une machine à remonter le temps (l'Internet Archive) pour récupérer toutes les versions de ces pages web depuis 2001. Ils ont reconstitué une chronologie complète, mois par mois, pour voir exactement quand l'arbre a grandi, quand il a accéléré sa croissance, et comment le nombre de profils a explosé au fil des ans.

2. Le "Dossier de chaque État" (Les données locales) 🗺️

Aux États-Unis, chaque État gère sa propre partie de la bibliothèque. Mais certains États sont très bavards et publient des rapports détaillés, tandis que d'autres sont silencieux et ne donnent aucune information. De plus, les règles changent d'un État à l'autre : certains autorisent la recherche de parents (recherche familiale) dans la base, d'autres l'interdisent strictement.

  • L'analogie : Imaginez 50 magasins différents qui vendent le même produit, mais avec des étiquettes de prix différentes, des règles de vente différentes, et certains qui ne montrent même pas leurs stocks.
  • Ce qu'ils ont fait : L'équipe a visité virtuellement les 50 États pour créer un tableau de bord unique. Ils ont noté qui collecte l'ADN des personnes arrêtées, qui autorise la recherche de famille, et combien de profils chaque État possède. C'est la première fois que toutes ces informations sont rassemblées au même endroit.

3. Le "Détective des Visages" (Les données démographiques) 👥

Une question cruciale est : "Qui se trouve dans cette bibliothèque ?" Est-ce que les profils reflètent la population générale, ou certains groupes sont-ils surreprésentés ?

  • L'analogie : C'est comme essayer de savoir la composition d'une foule, mais la plupart des organisateurs refusent de donner la liste des participants.
  • Ce qu'ils ont fait : Ils ont numérisé et organisé des documents rares obtenus par des demandes officielles (FOIA) auprès de sept États. Bien que ce ne soit pas toutes les données possibles, c'est comme avoir trouvé les seuls carnets de notes complets dans un océan de documents perdus. Cela permet d'analyser la répartition par sexe et par race pour ces États.

🛠️ Comment ont-ils travaillé ? (La cuisine derrière le plat)

Rassembler ces données n'était pas simple. Le site du FBI a changé de look plusieurs fois au cours des 25 ans (comme un restaurant qui change de décoration).

  • Les chercheurs ont écrit des robots intelligents (des scripts informatiques) capables de lire les anciennes pages web, les nouvelles, et celles du milieu, pour extraire les chiffres exacts.
  • Ils ont aussi mis en place un système d'alerte (comme un détecteur de fumée). Parfois, un chiffre saute brusquement (par exemple, le nombre de profils double en une nuit). Le système marque ces anomalies pour dire : "Attention, vérifiez ça, c'est peut-être une erreur d'écriture ou un bug, pas une vraie explosion de la criminalité !"

🎯 Pourquoi est-ce important ?

Ce travail est une boîte à outils pour les chercheurs, les journalistes et les citoyens.

  • Cela permet de voir si les lois ont changé la façon dont la police collecte l'ADN.
  • Cela aide à comprendre si la base de données grandit de manière équitable.
  • Cela rend la transparence possible là où il y avait auparavant du flou.

En résumé, ces chercheurs ont transformé des données éparpillées, cachées ou illisibles en un grand livre d'histoire clair et accessible sur l'évolution de la police génétique aux États-Unis. Ils ont nettoyé la poussière des archives pour que nous puissions mieux comprendre l'avenir de la justice.