Elucidating the Size of Chemical Space with Assembly Theory

Cet article utilise la théorie de l'assemblage, une mesure de la complexité moléculaire fondée sur les premiers principes et basée sur des opérations récursives de jonction de liaisons, pour réestimer la taille de l'espace chimique, révélant que sous des contraintes de type médicament (masse < 500 Da), le nombre de molécules possibles atteint environ 10^117 à un indice d'assemblage de 25, passant d'une croissance super-exponentielle à une croissance doublement exponentielle à mesure que la complexité augmente.

Auteurs originaux : Juan Carlos Morales Parra, Keith Y Patarroyo, Abhishek Sharma, David Obeh Alobo, Leroy Cronin

Publié 2026-06-11
📖 5 min de lecture🧠 Analyse approfondie

Auteurs originaux : Juan Carlos Morales Parra, Keith Y Patarroyo, Abhishek Sharma, David Obeh Alobo, Leroy Cronin

Article original sous licence CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ⚕️ Ceci est une explication générée par l'IA d'un preprint qui n'a pas été évalué par des pairs. Ce n'est pas un avis médical. Ne prenez pas de décisions de santé basées sur ce contenu. Lire la clause de non-responsabilité complète

Imaginez que vous essayiez de compter chaque château Lego possible que vous pourriez construire. Vous pourriez vous dire : « Eh bien, il y a tellement de façons d'assembler des briques que le nombre est pratiquement infini. » Des scientifiques ont déjà essayé de deviner ce nombre par le passé, affirmant souvent qu'il existe environ 10 à la puissance 60 (un 1 suivi de 60 zéros) de molécules « de type médicament ». Mais ces suppositions avaient un défaut : elles comptaient toutes les combinaisons possibles de briques, même celles qui s'effondreraient immédiatement ou qui n'auraient aucun sens physique. Elles ne demandaient pas : « À quel point est-il difficile de construire ceci ? »

Ce document présente une nouvelle façon de compter l'univers des molécules possibles en utilisant un concept appelé Théorie de l'Assemblage (Assembly Theory). Voyez cela non pas seulement comme le comptage du château final, mais comme le comptage du nombre minimum d'étapes nécessaires pour le construire.

Voici la décomposition de leurs découvertes en utilisant des analogies simples :

1. La métrique du « Manuel d'instructions »

Imaginez que vous avez une molécule spécifique. Pour la construire, vous avez besoin d'un ensemble d'instructions.

  • L'ancienne méthode : Compter simplement combien d'atomes se trouvent dans la molécule.
  • La nouvelle méthode (Théorie de l'Assemblage) : Compter le nombre minimum de mouvements d'« emboîtement » nécessaires pour la construire à partir de zéro.
    • Si vous avez une longue chaîne de perles identiques, vous pouvez construire cela rapidement en dupliquant un petit morceau encore et encore. C'est un objet à « faible complexité ».
    • Si vous avez une molécule où chaque partie est unique et que vous devez les attacher une par une, cela prend beaucoup plus d'étapes. C'est un objet à « haute complexité ».

Les auteurs appellent ce nombre d'étapes l'Indice d'Assemblage. C'est comme une « évaluation de la difficulté » de construction.

2. L'« Univers Lego » vs Le « Monde Réel »

Le document distingue deux espaces :

  • L'Univers d'Assemblage : C'est l'espace théorique de toutes les formes possibles que vous pourriez réaliser avec des briques Lego, même si la forme est instable ou impossible à maintenir ensemble dans la réalité.
  • L'Espace Chimique : C'est le sous-ensemble du « Monde Réel ». Il n'inclut que les molécules qui sont physiquement stables et qui peuvent réellement exister (comme celles de la base de données GDB-13, qui contient près d'un milliard de molécules de type médicament réelles).

Les chercheurs ont utilisé la base de données GDB-13 comme une carte pour voir à quel point l'espace chimique du « Monde Réel » est vaste.

3. À quelle vitesse l'espace croît-il ?

La grande question était : À mesure que le « niveau de difficulté » (Indice d'Assemblage) augmente, à quelle vitesse le nombre de molécules possibles explose-t-il ?

  • La découverte : Le nombre de molécules possibles croît très rapidement.
    • Il croît plus vite qu'une courbe exponentielle standard (comme les intérêts composés).
    • Il croît à un rythme situé quelque part entre le « super-exponentiel » et le « double-exponentiel ».
    • L'analogie : Si vous imaginez le nombre de molécules comme un ballon, la croissance standard est comme le gonfler lentement. Ce document suggère que le ballon se gonfle si vite qu'il est pratiquement en train d'exploser.

4. L'effet de « Filtre »

Le document a également examiné ce qui se passe lorsque l'on applique des « filtres » au jeu de Lego.

  • Pas de cycles : Si vous n'autorisez que des chaînes droites d'atomes (pas de boucles), l'espace croît d'une certaine manière.
  • Avec des cycles : Si vous autorisez les atomes à former des boucles (cycles), les molécules ont tendance à être plus « symétriques » (plus faciles à construire en copiant des parties), ce qui modifie la façon dont l'espace croît.
  • Motifs spécifiques : Si vous exigez qu'une molécule possède une forme spécifique (comme un cycle carré), l'espace rétrécit, mais il reste astronomiquement vaste.

5. Le décompte final

Lorsque les chercheurs ont appliqué toutes les règles standards pour les molécules « de type médicament » (des critères tels que : doit avoir un poids inférieur à un certain seuil, doit être stable, doit posséder certains types d'atomes) et ont regardé les molécules ayant un Indice d'Assemblage de 25, ils ont calculé la taille de cet espace.

Le résultat : Il existe environ 10 à la puissance 117 molécules possibles.

Pour mettre cela en perspective :

  • L'estimation précédente était de 10^60.
  • La nouvelle estimation est de 10^117.
  • C'est un nombre si grand qu'il dépasse largement le nombre d'atomes dans l'univers observable tout entier.

Résumé

Le document soutient que l'« univers des molécules possibles » n'est pas seulement grand ; il est d'une immensité vertigineuse, et il croît à un rythme terrifiant à mesure que la complexité augmente. En utilisant une méthode de « comptage d'étapes » (Théorie de l'Assemblage) plutôt que de simplement compter les atomes, ils ont découvert que même avec des règles strictes sur ce qui constitue un bon médicament, le nombre de possibilités est d'environ 10^117. Cela suggère que trouver une molécule spécifique et utile dans cet océan de possibilités est une tâche incroyablement difficile, simplement parce que l'océan est bien plus vaste que nous ne le pensions auparavant.

Noyé(e) sous les articles dans votre domaine ?

Recevez des digests quotidiens des articles les plus récents correspondant à vos mots-clés de recherche — avec des résumés techniques, dans votre langue.

Essayer Digest →