Pushing the limits of one-dimensional NMR spectroscopy for automated structure elucidation using artificial intelligence

Dit artikel presenteert een deep learning-framework gebaseerd op transformer-architectuur dat succesvol automatische de novo structuurofklaring bereikt voor organische moleculen met tot 40 niet-waterstofatomen met behulp van slechts ééndimensionale 1^1H- en 13^{13}C-NMR-spectra, waarbij de doelmolecuul correct wordt geïdentificeerd binnen de top 15 voorspellingen in 60,4% van de gevallen.

Oorspronkelijke auteurs: Frank Hu, Jonathan M. Tubb, Dimitris Argyropoulos, Sergey Golotvin, Mikhail Elyashberg, Grant M. Rotskoff, Matthew W. Kanan, Thomas E. Markland

Gepubliceerd 2026-06-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Oorspronkelijke auteurs: Frank Hu, Jonathan M. Tubb, Dimitris Argyropoulos, Sergey Golotvin, Mikhail Elyashberg, Grant M. Rotskoff, Matthew W. Kanan, Thomas E. Markland

Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven of goedgekeurd door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer

Stel je voor dat je een detective bent die een mysterie probeert op te lossen, maar in plaats van vingerafdrukken of een getuige, heb je alleen een enkele, wazige foto van de schaduw van de verdachte. Jouw taak is om het volledige gezicht, lichaam en de kleding van de verdachte te reconstrueren aan de hand van slechts die ene schaduw.

Dit is in essentie wat chemici ondergaan wanneer ze proberen de structuur van een nieuw molecuul te achterhalen met behulp van alleen 1D NMR-spectroscopie.

De Onmogelijke Puzzel

In de wereld van de chemie is een molecuul als een complexe Lego-structuur. Voor een middelgroot molecuul (één met ongeveer 36 tot 40 "zware" atomen zoals koolstof, stikstof of zuurstof), zijn er meer mogelijke manieren om die Lego-blokjes aan elkaar te klikken dan er korrels zand op alle stranden van de aarde zijn. Het papier schat dat dit aantal tussen de 102010^{20} en 106010^{60} ligt.

Traditioneel werd het vaststellen van welke specifieke Lego-structuur je precies hebt met behulp van alleen een eenvoudige 1D NMR "schaduw" (een spectrum) beschouwd als onmogelijk. Het is alsof je probeert de exacte arrangement van een miljard Lego-steentjes te raden door alleen naar een enkele, platte schaduw te kijken. Meestal hebben chemici meer aanwijzingen nodig, zoals 2D NMR (dat een 3D-kaart geeft) of het exacte lijstje met ingrediënten (de moleculaire formule) om de puzzel op te lossen.

De AI-Detective

De onderzoekers in dit artikel hebben een superintelligente AI-detective gebouwd (een "Transformer"-model, dezelfde technologie achter veel moderne chatbots) die deze puzzel kan oplossen met behulp van alleen de 1D NMR-schaduw.

Zo hebben ze de AI getraind, via een slim twee-stappenproces:

Stap 1: De taal van vormen leren (Pre-training)
Voordat de AI naar de NMR-schaduwen kon kijken, leerden ze het een ander spelletje. Ze gaven de AI "Morgan fingerprints" — die werken als digitale barcodes die de kleine stukjes (fragmenten) van een molecuul beschrijven — en vroegen de AI om de volledige Lego-structuur te bouwen vanuit die barcodes.

  • De Analogie: Stel je voor dat je een kind leert een huis te bouwen door het een lijst met stenen te laten zien (ramen, deuren, muren) en het vervolgens te vragen het huis te assembleren.
  • Het Resultaat: De AI werd een meesterbouwer. Het kon naar een lijst met fragmenten kijken en de volledige huisstructuur in 97,8% van de gevallen correct reconstrueren.

Stap 2: De echte test (Spectrum naar Structuur)
Zodra de AI een meesterbouwer was, leerden ze de AI de echte taak: kijken naar de NMR- "schaduw" en direct de Lego-structuur raden.

  • Ze gaven de AI niet de lijst met ingrediënten (de moleculaire formule).
  • Ze gaven de AI geen 3D-kaart.
  • Ze gaven de AI alleen het 1D NMR-spectrum.

De Resultaten: Het Onoplosbare Oplossen

De AI verrichtte wonderen bij deze onmogelijke taak:

  • Nauwkeurigheid: Voor moleculen tot 40 atomen lang, raadde de AI de juiste structuur binnen zijn top 15 suggesties ongeveer 60% van de tijd.
  • De "Schaduw" vs. De "Kaart": Zelfs als de AI niet het exacte juiste antwoord had, kwam hij meestal heel dichtbij. Als de AI het fout had, was de gesuggereerde structuur vaak voor 82% vergelijkbaar met het echte molecuul. Het is alsof de detective raadt dat de verdachte een rode hoed draagt in plaats van een blauwe, maar de rest van de outfit goed heeft.
  • Eén oog is genoeg: Verrassend genoeg kon de AI het grootste deel van dit werk doen met alleen het Waterstof (1H) NMR-spectrum, zonder de Koolstof (13C) data nodig te hebben. Het haalde nog steeds 46,6% van de keren het juiste antwoord in zijn top 15 suggesties.
  • Aanpasbaarheid in de echte wereld: De AI werd getraind op computersimulaties, maar de onderzoekers lieten zien dat het ook "fijn afgesteld" kan worden met slechts 50 echte experimentele spectra. Zelfs met deze kleine hoeveelheid echte data sprong de nauwkeurigheid op echte data van 0% naar 21,5%.

Waarom dit ertoe doet

Denk aan de chemische ruimte als een bibliotheek met 106010^{60} boeken. Het vinden van het specifieke boek dat je nodig hebt door alleen de cover te lezen (het 1D NMR-spectrum) werd als onmogelijk beschouwd. Deze AI vindt niet alleen het boek; het verkleint de zoektocht tot een kleine stapel van 15 boeken, waarvan er 6 waarschijnlijk degene zijn die je wilt hebben.

Het artikel concludeert dat deze tool wetenschappers in staat stelt om de dure, tijdrovende stappen van het verkrijgen van complexere data over te slaan. Het fungeert als een krachtig filter dat de oneindige mogelijkheden van chemische structuren snel terugbrengt naar een hanteerbaar aantal, gebaseerd op de eenvoudigste, meest voorkomende data die beschikbaar zijn in een chemisch laboratorium.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →