Oorspronkelijk artikel gelicentieerd onder CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dit is een AI-gegenereerde uitleg van het onderstaande artikel. Het is niet geschreven door de auteurs. Raadpleeg het oorspronkelijke artikel voor technische nauwkeurigheid. Lees de volledige disclaimer
Stel je voor dat je een computer probeert te leren het concept van "wanorde" of "slordigheid" te begrijpen. In de wereld van de wetenschap wordt dit concept Entropie genoemd.
Normaal gesproken behandelen wetenschappers deze vorm van "slordigheid" op twee zeer verschillende manieren:
- In een chemische fabriek: Engineers track heat and reactions. Inefficient heat transfer and irreversible reactions increase entropy, indicating energy losses. De regel hier is simpel: Je kunt een kamer nooit weer netjes maken. (Dit is de Tweede Wet van de Thermodynamica).
- Op de aandelenmarkt: Ze kijken naar hoe onvoorspelbaar aandelenkoersen zijn. Als prijzen wild heen en weer springen, is de "informatie-entropie" hoog.
Het probleem is dat computers deze twee zaken meestal apart leren. Ze hebben één brein voor chemische fabrieken en een totaal ander brein voor de aandelenmarkt. Ze realiseren zich niet dat "wanorde" eigenlijk hetzelfde abstracte concept is in beide gevallen.
Dit paper introduceert een nieuw soort computerbrein genaamd Physics-Informed Deep Learning (PIDL). Zie dit als een universele vertaler die de regels van "wanorde" één keer leert en deze vervolgens tegelijkertijd toepast op zowel chemische fabrieken als aandelenmarkten.
Hier is hoe ze het aanpakten, onderverdeeld in eenvoudige delen:
1. De twee testgevallen
De onderzoekers testten hun nieuwe brein op twee zeer verschillende "spelletjes":
Spel A: De chemische reactor (de CSTR)
Stel je een enorme, geroerde pot voor waarin chemicaliën worden gemengd en verhit. De computer moet de temperatuur en de hoeveelheid resterende chemicaliën voorspellen.- De uitdaging: De computer mag nooit voorspellen dat de reactie "negatieve wanorde" creëert (wat fysiek onmogelijk is).
- De oplossing: Ze bouwden een harde regel direct in de code van de computer (met behulp van een "Softplus" activatie). Het is alsoals het plaatsen van een fysieke poort op een deur die niet de verkeerde kant op geopend kan worden. Hoe in de war de computer ook raakt, hij kan fysiek geen negatief getal voor entropie produceren.
Spel B: De aandelenmarkt (Financiële rendementen)
Stel je voor dat je probeert te voorspellen hoe aandelenkoersen bewegen op basis van een wiskundige vergelijking genaamd de Fokker-Planck vergelijking.- De uitdaging: De computer moet de verborgen regels (drift en diffusie) raden die de bewegingen van de aandelen veroorzaken, enkel gebaseerd op het zien van de uiteindelijke grafieken van de koersen.
- De oplossing: De computer leert dat de totale waarschijnlijkheid van alle uitkomsten altijd samen 100% moet zijn (je kunt niet meer dan 100% van de markt hebben).
2. Het "Gedeelde Brein" experiment
De onderzoekers probeerden drie verschillende opstellingen:
- Brein A: Leert alleen over chemie.
- Brein B: Leert alleen over aandelen.
- Brein C (De gedeelde encoder): Een enkel brein met een "gemeenschappelijke kamer" waar het de algemene opvatting van "wanorde" opslaat, en vervolgens twee verschillende "gespecialiseerde kamers" gebruikt om die kennis toe te passen op chemie of aandelen.
De resultaat: Het Gedeelde Brein (Brein C) was zelfs beter in het voorspellen van zaken dan de twee gespecialiseerde breinen, ook al had het minder neuronen in totaal (het was kleiner en goedkoper om te draaien). Dit bewijst dat de computer succesvol heeft geleerd dat "wanorde" in een chemische pot en "wanorde" in de aandelenmarkt wiskundig gezien vergelijkbare concepten zijn.
3. Leren met minder data (Het "Spiekbriefje-effect")
Normaal gesproken heeft AI duizenden voorbeelden nodig om te leren. Maar omdat dit nieuwe brein "regels" ingebouwd heeft (zoals "entropie moet positief zijn" of "waarschijnlijkheden moeten optellen tot 1"), hoeft het minder te gokken.
- De bevinding: Het nieuwe brein kon net zo goed leren met slechts 30% van de data die een normale computer nodig zou hebben. Het is als een student die de wetten van de natuurkunde kent en daardoor een probleem kan oplossen met minder oefenvragen dan een student die alleen antwoorden uit het hoofd leert.
4. De "Thermodynamische Röntgenfoto" (Ruppeiner-kromming)
Nadat de computer de chemische reactor had geleerd, gebruikten de onderzoekers een speciale wiskundige tool (de Ruppeiner-geometrie) om naar de "vorm" van de kennis van de computer te kijken.
- De metafoor: Stel je voor dat de kennis van de computer een landschap is. Vlakke gebieden zijn veilig. Heuvels zijn oké. Maar diepe dalen (negatieve kromming) zijn gevaarlijk.
- De ontdekking: De computer heeft, zonder expliciet te zijn verteld om naar gevaar te zoeken, vanzelf geleerd om diepe dalen te tekenen op precies de plekken waar de chemische reactor zou ontploffen (thermische runaway). Het vond de "instabiliteit" simpelweg door het begrijpen van de vorm van de entropie.
Samenvatting van wat zij claimen
- Verenigd leren: Je kunt één AI leren om entropie in zowel chemie als financiën te begrijpen, omdat de onderliggende wiskunde vergelijkbaar is.
- Harde regels werken: In plaats van de AI alleen maar te "vragen" om de wetten van de natuurkunde te volgen (wat de AI zou kunnen negeren), kun je de wetten in de structuur van de AI bouwen, zodat deze ze niet kan breken.
- Data-efficiëntie: Deze methode werkt uitstekend, zelfs wanneer je weinig data hebt om op te trainen.
- Verborgen inzichten: De AI kan verborgen gevaren (zoals explosies in reactoren) onthullen door simpelweg de geometrie van zijn eigen voorspellingen te analyseren.
Wat zij NIET claimen:
- Ze hebben niet gezegd dat dit systeem momenteel in echte fabrieken wordt gebruikt of op Wall Street wordt gebruikt om aandelen te verhandelen.
- Ze hebben niet beweerd dat het werkt voor biologische systemen of ecologische netwerken (hoewel ze suggereren dat het in de toekomst zou kunnen).
- Ze hebben niet beweerd dat het de aandelenmarkt oplost; ze claimden alleen dat het succesvol de wiskunde van de verdeling van aandelenrendementen heeft gemodelleerd.
Kortom, dit paper laat zien dat als je een computer de fundamentele regels van "wanorde" leert, het een slimmere, veiligere en efficiëntere leerling kan worden voor zeer verschillende soorten problemen.
Verdrinkt u in papers in uw vakgebied?
Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.