On the Reliability of AI Methods in Drug Discovery: Evaluation of Boltz-2 for Structure and Binding Affinity Prediction

Hoewel Boltz-2 snelle voorspellingen biedt voor het initiële screenen van geneesmiddelen, concludeert deze studie dat het model vanwege gebrek aan energetische precisie en zwakke correlaties met fysisch gebaseerde methoden onvoldoende betrouwbaar is voor de identificatie van leidende verbindingen in de medicijnontwikkeling.

Shunzhou Wan, Xibei Zhang, Xiao Xue, Peter V. Coveney

Gepubliceerd Mon, 09 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je op zoek bent naar de perfecte sleutel voor een heel specifieke, ingewikkelde slot. Dat slot is een ziekteverwekkend eiwit in je lichaam, en de sleutel is een nieuw medicijn. Als de sleutel perfect past, werkt het medicijn. Als hij niet past, doet hij niets.

Deze wetenschappelijke studie is als een grote test van een nieuwe, supersnelle robot (genaamd Boltz-2) die beloofd heeft om duizenden sleutels in een flits te ontwerpen en te zeggen welke het beste past. De onderzoekers wilden weten: is deze robot echt zo slim als ze zeggen, of is het gewoon een dure tovertruc?

Hier is wat ze hebben ontdekt, vertaald naar alledaagse taal:

1. De Belofte vs. De Realiteit

De robot (Boltz-2) is gebaseerd op kunstmatige intelligentie (AI). Hij is getraind op miljoenen voorbeelden en kan in een paar seconden voorspellen hoe een medicijn aan een eiwit plakt. Dat is ongelooflijk snel.

  • De droom: De robot zou de dure, trage natuurkundige berekeningen kunnen vervangen die wetenschappers nu gebruiken.
  • De test: De onderzoekers lieten de robot 38.000 verschillende "sleutels" (moleculen) ontwerpen voor twee verschillende "sloten" (eiwitten die betrokken zijn bij corona en kanker). Vervolgens vergelijkt ze deze met de oude, vertrouwde methode: een zeer nauwkeurige, maar trage natuurkundige simulatie (genaamd ESMACS).

2. Het Grote Misverstand: De Sleutel past niet altijd

Toen ze de ontwerpen van de robot bekeken, zagen ze een vreemd fenomeen:

  • De robot droomt: De robot lijkt te denken dat er niet één perfecte plek is waar de sleutel past, maar dat hij overal kan plakken. Soms zag hij de sleutel in een heel andere kamer van het huis hangen dan waar hij eigenlijk moet zitten.
  • De trage methode: De oude, trage natuurkundige methode zag precies waar de sleutel moest zitten.
  • Het probleem: De robot is zo snel, maar hij is soms zo creatief dat hij vergeten is dat een sleutel maar op één manier in een slot past. Hij ziet soms een sleutel die wel past, maar dan ondersteboven of op zijn kop.

3. De "Gouden Top 100" en de Teleurstelling

De onderzoekers keken naar de 100 beste sleutels die de robot had geselecteerd. Ze dachten: "Oké, de robot is misschien niet perfect voor alles, maar hij moet toch wel de allerbeste vinden."

  • Het resultaat: Niets was minder waar. Als je deze top 100 vergelijkt met de trage, nauwkeurige methode, was er geen enkele overeenkomst. De robot had totaal andere 100 sleutels gekozen dan de natuurkunde.
  • De analogie: Het is alsof de robot een lijst maakt van de 100 snelste auto's ter wereld, maar hij vergeet dat hij eigenlijk op zoek is naar de auto's die het beste over een modderweg rijden. Hij kijkt naar de snelheid, maar niet naar de bruikbaarheid.

4. De "Chemische Foutjes" (De Verkeerde Kleur)

Er was nog een gekke ontdekking. De robot ontwierp moleculen die er chemisch gezien niet helemaal goed uitzagen.

  • Voorbeeld: Stel je voor dat de robot een auto tekent, maar hij maakt de wielen van rubber in plaats van metaal, of hij tekent een auto die net iets te veel brandstof heeft.
  • In de studie zag men dat de robot soms atomen (de bouwstenen van het medicijn) verkeerd "satureerde". Hij maakte een ring van koolstofatomen soms te onstabiel of veranderde de vorm van een staartje. Dit lijkt klein, maar in de chemie is het alsof je de sleutel van koper maakt in plaats van staal: hij breekt of past niet meer.

5. Waarom is dit belangrijk?

De onderzoekers concluderen dat AI (zoals Boltz-2) geweldig is voor het snel scannen van enorme lijsten. Het is als een metaalzoeker op het strand: hij piept snel als hij iets metaals voelt.

  • Maar: Hij kan je niet vertellen of het een gouden munt is of een oude blikje. Voor dat laatste heb je de "oude, trage methode" nodig (de natuurkundige simulaties).
  • De robot mist de energetische precisie. Hij kan zeggen "dit lijkt op een sleutel", maar hij kan niet precies berekenen "hoe stevig deze sleutel in het slot draait".

De Conclusie in één zin

Boltz-2 is een snelle, slimme assistent die je kan helpen om duizenden ideeën te filteren, maar je kunt hem niet blindelings vertrouwen om de uiteindelijke winnaar te kiezen. Je moet zijn ideeën altijd controleren met de zware, betrouwbare natuurkunde, anders bouw je medicijnen op een fundering van zand.

Kortom: AI is een fantastische schetsmaker, maar voor de feitelijke bouw van medicijnen hebben we nog steeds de oude, nauwkeurige ingenieurs nodig.