Automated Extraction of Material Properties using LLM-based AI Agents

Deze studie presenteert een geautomatiseerde, LLM-gestuurde workflow die duizenden wetenschappelijke artikelen analyseert om het grootste tot nu toe bestaande dataset van thermoelektrische eigenschappen en structurele kenmerken te creëren, waarmee de weg vrijgemaakt wordt voor schaalbare, datagedreven materiaalontdekking.

Subham Ghosh, Abhishek Tewari

Gepubliceerd 2026-03-10
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat er een enorme bibliotheek bestaat, gevuld met miljoenen wetenschappelijke boeken over materialen. In deze boeken staan de geheimen van nieuwe, superieure materialen voor bijvoorbeeld energieopslag of koeling. Maar er is een groot probleem: deze informatie zit opgesloten in onleesbare tekst en ingewikkelde tabellen. Het is alsof je een schatkaart hebt, maar de schat is begraven onder een berg ongestructureerd papier.

De onderzoekers van dit paper (Subham Ghosh en Abhishek Tewari van het IIT Roorkee in India) hebben een slimme oplossing bedacht: een digitale bibliotheekaris met een supergeheugen.

Hier is hoe hun werk werkt, vertaald naar alledaagse taal:

1. De Digitale Bibliotheekaris (De AI-Agenten)

In plaats van dat mensen jarenlang moeten zitten om handmatig gegevens uit boeken te halen, hebben de onderzoekers een team van AI-assistenten (zogenaamde "agents") gebouwd. Denk aan hen als een team van zeer gespecialiseerde bibliothecarissen:

  • De Zoeker: Deze kijkt eerst door de tekst om te zien welke materialen er überhaupt worden besproken.
  • De Getallenmeester: Deze haalt de specifieke cijfers uit de tekst (zoals hoe goed een materiaal warmte omzet in stroom).
  • De Structuur-expert: Deze kijkt naar de bouw van het materiaal (zoals de kristalstructuur).
  • De Tabel-lezer: Deze is gespecialiseerd in het lezen van de vaak rommelige tabellen in de artikelen, waar de meeste belangrijke data staat.

Deze teamleden werken samen in een geautomatiseerd proces. Ze lezen ongeveer 10.000 wetenschappelijke artikelen en halen er de belangrijkste informatie uit.

2. De Slimme Kostenbesparing (De "Mini" vs. "Pro")

Een groot probleem bij het gebruik van slimme AI is dat het duur is. Het is alsof je een dure, krachtige supercomputer huurt om een simpele e-mail te schrijven.
De onderzoekers hebben verschillende AI-modellen getest. Ze ontdekten dat de "Pro"-versie (GPT-4.1) het allerbeste werk deed, maar heel duur was. De "Mini"-versie (GPT-4.1 Mini) deed bijna even goed werk, maar kostte 5 tot 10 keer minder.

  • De analogie: Het is alsof je een Formule 1-auto (de dure AI) gebruikt om naar de supermarkt te rijden. Je kunt ook een kleine, zuinige elektrische auto (de goedkope AI) gebruiken. Hij rijdt net zo snel voor dit doel, maar je bespaart enorm veel benzine (geld). Ze kozen daarom voor de "Mini" om de hele bibliotheek te doorzoeken.

3. Het Grote Schatje (De Dataset)

Na het doorzoeken van die 10.000 artikelen hebben ze een enorme database gecreëerd met 27.822 nieuwe gegevenspunten.
Stel je voor dat je eerder alleen losse losse puzzelstukjes had, en nu heb je ineens een compleet plaatje. Deze database bevat informatie over:

  • Hoe goed materialen elektriciteit en warmte geleiden.
  • Bij welke temperaturen ze werken.
  • Hoe ze chemisch zijn opgebouwd.

4. Wat hebben ze ontdekt?

Met deze nieuwe database konden ze oude theorieën bevestigen en nieuwe patronen zien.

  • De Analogie: Het is alsof je eindelijk alle statistieken van honderden honderden voetbalwedstrijden in één overzicht hebt. Je ziet dan ineens duidelijk: "Oh, teams die veel aanvallend spelen (zoals 'alloys' of legeringen) winnen vaker dan teams die verdedigend spelen (zoals 'oxides')."
  • Ze zagen bijvoorbeeld dat bepaalde materialen (legeringen) veel beter presteren dan andere (oxides), en dat het toevoegen van bepaalde stoffen (doping) het materiaal sterker maakt.

5. De Openbare Bibliotheek (De Website)

Het mooiste is dat ze deze database niet voor zichzelf houden. Ze hebben een gratis, interactieve website gemaakt.

  • Hoe het werkt: Iedereen kan nu op deze site zoeken. Je kunt zeggen: "Ik wil materialen zoeken die werken bij hoge temperaturen en goedkoop zijn." De site filtert direct de resultaten.
  • Het is alsof ze de sleutel van de bibliotheek aan de hele wereld hebben gegeven, zodat elke onderzoeker, student of ingenieur direct kan beginnen met het bouwen van de materialen van de toekomst.

Samenvatting

Kortom: Deze onderzoekers hebben een robot-team gebouwd dat duizenden saaie wetenschappelijke boeken leest, de belangrijke cijfers eruit haalt, en die in een gebruiksvriendelijke database stopt. Ze hebben een slimme manier gevonden om dit goedkoop te doen, en ze hebben de deuren opengezet voor iedereen om deze nieuwe kennis te gebruiken. Dit versnelt de ontdekking van nieuwe materialen voor een schonere en efficiëntere wereld.