Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

Cet article présente un cadre modulaire multimodal utilisant l'intelligence artificielle générative pour produire de manière accessible et réaliste des données synthétiques sur les bâtiments résidentiels à partir d'images publiques, afin de réduire la dépendance aux sources de données coûteuses ou restreintes pour la recherche en simulation énergétique.

Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra

Publié 2026-03-10
📖 4 min de lecture☕ Lecture pause café

Each language version is independently generated for its own context, not a direct translation.

Imaginez que vous voulez construire une maquette parfaite d'une ville entière pour prédire comment elle consommera de l'électricité dans le futur. Le problème ? Pour faire cette maquette, vous auriez besoin de connaître les secrets de chaque maison : la qualité de l'isolation, l'âge de la chaudière, la forme exacte du toit, etc.

Mais obtenir ces informations est un cauchemar : c'est cher, les données sont souvent cachées pour des raisons de confidentialité, ou tout simplement introuvables. C'est un peu comme essayer de cuisiner un gâteau sans avoir la recette, sans pouvoir acheter les ingrédients, et sans même savoir de quelle couleur est le four.

C'est là que cette recherche intervient avec une idée géniale : créer des "maisons virtuelles" (des données synthétiques) à l'aide d'une intelligence artificielle.

Voici comment ils ont fait, expliqué simplement :

1. Le Détective Numérique (Le "Scraping")

Au lieu de voler des données privées, les chercheurs ont envoyé un petit robot numérique (un "scraper") sur des sites publics de comtés américains. Ce robot est un peu comme un détective très rapide qui parcourt des milliers de pages pour noter des faits simples et publics : "Cette maison a 3 chambres", "Elle a été construite en 1980", "Elle fait 200 mètres carrés". Il télécharge aussi deux photos : une vue de la rue et un plan du sol.

2. L'Œil de Faucon (L'IA qui regarde les images)

Ensuite, ils ont utilisé une IA spéciale (appelée LLaVA) pour analyser ces photos. Imaginez que vous montrez une photo de toiture à un expert en bâtiment. L'IA doit dire : "Tiens, ce toit semble vieux et abîmé" ou "Ce toit est neuf".

Les chercheurs ont dû s'assurer que l'IA ne se trompait pas en regardant les arbres à côté de la maison ou la couleur de la voiture garée devant. Ils ont fait un test drôle : ils ont caché (occlus) des parties de l'image pour voir si l'IA changeait d'avis.

  • Résultat : Une IA classique (GPT) regardait tout un peu au hasard, comme un enfant qui regarde partout. Mais l'IA choisie (LLaVA) a agi comme un vrai expert : elle s'est concentrée uniquement sur le toit, même quand on cachait le reste de la photo. Elle a compris que c'est le toit qui compte pour l'énergie, pas l'herbe du jardin.

3. L'Architecte et l'Inspecteur (La Génération de Données)

Une fois que l'IA a décrit la maison, ils ont utilisé un autre cerveau artificiel (GPT) pour inventer le reste de l'histoire de la maison, mais de manière réaliste.

  • L'Architecte : Il crée un plan numérique (GeoJSON) avec la forme exacte de la maison.
  • L'Inspecteur : Il rédige un rapport fictif mais crédible : "Le toit a un bon isolant (R-value 30), la chaudière est vieille mais fonctionne, il y a des courants d'air..."

C'est comme si l'IA écrivait une biographie complète pour une maison qui n'existe pas encore, mais qui ressemble tellement à la réalité qu'on y croirait.

4. Le Simulateur de Météo et d'Énergie (EnergyPlus)

Enfin, ils prennent toutes ces données inventées et les donnent à un logiciel de simulation très puissant (EnergyPlus). Ce logiciel fait tourner des milliers d'années de météo virtuelle sur ces maisons virtuelles pour calculer : "Si cette maison existait vraiment, combien d'électricité consommerait-elle en hiver ?"

Pourquoi est-ce une révolution ?

Imaginez que vous vouliez tester des solutions pour économiser l'énergie dans une ville. Avant, il fallait attendre des années pour avoir assez de données réelles, ou payer une fortune pour les acheter.

Avec cette méthode :

  • C'est gratuit (ou presque) : Ils ont créé des données pour 258 maisons pour environ 0,36 dollar (le coût des questions posées à l'IA). C'est comme acheter un bonbon au lieu d'une maison entière !
  • C'est rapide : En quelques heures, ils ont créé un échantillon de données qui serait normalement impossible à obtenir.
  • C'est réaliste : Ils ont comparé leurs maisons virtuelles avec des données réelles américaines (ResStock) et ont vu que les chiffres correspondaient parfaitement. C'est comme si vous aviez créé des poupées russes qui ont exactement la même taille que les vraies personnes.

En résumé :
Les chercheurs ont créé une "usine à maisons virtuelles". Ils prennent des photos publiques, utilisent l'IA pour deviner les détails cachés, inventent des rapports d'inspection crédibles, et simulent la consommation d'énergie. Cela permet aux scientifiques de tester des idées pour sauver la planète et économiser de l'argent, sans avoir besoin de voler les secrets des voisins ou de dépenser des millions. C'est de la magie numérique au service de l'écologie !