Towards Cognitive Defect Analysis in Active Infrared Thermography with Vision-Text Cues

Dit artikel introduceert een taalgeleid raamwerk voor cognitieve defectanalyse in actieve infraroodthermografie van CFK-materialen, dat gebruikmaakt van vooraf getrainde vision-language modellen en een lichte adapter om zero-shot defectdetectie mogelijk te maken zonder uitgebreide trainingsdatasets.

Mohammed Salah, Eman Ouda, Giuseppe Dell'Avvocato, Fabrizio Sarasini, Ester D'Accardi, Jorge Dias, Davor Svetinovic, Stefano Sfarra, Yusra Abdulrahman

Gepubliceerd Thu, 12 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een heel duur, supersterk vliegtuigvleugel maakt van koolstofvezel (CFRP). Deze materialen zijn licht en sterk, maar ze hebben een geheim: ze kunnen onzichtbare barstjes of loslatende lagen hebben diep van binnen, net zoals een appel die van buiten perfect lijkt, maar van binnen rot is.

Om deze "rotte plekken" te vinden, gebruiken ingenieurs Actieve Infrarood Thermografie (AIRT). Dit is een beetje zoals het maken van een warmtefoto van de vleugel. Je verwarmt het oppervlak even snel met flitslichten of lampen. Als er ergens een defect zit, blijft de warmte daar anders hangen dan op een gezond stukje. Een camera ziet dit als een vreemd warmtepatroon.

Het oude probleem: De "Leerling" die veel moet studeren
Vroeger probeerden computers deze warmtepatronen te analyseren met kunstmatige intelligentie (AI). Maar om die AI slim te maken, moesten mensen duizenden foto's maken van defecten, die vervolgens handmatig moeten worden gemarkeerd (zeggen: "hier zit een barst"). Dit is extreem duur, tijdrovend en lastig. Het is alsof je een kind wilt leren vliegen, maar je moet eerst duizenden uren besteden aan het maken van oefenvluchten voordat het kind ook maar één keer mag vliegen.

De nieuwe oplossing: De "Tolken" en de "Superlezer"
De auteurs van dit paper hebben een slimme nieuwe manier bedacht die geen enkele training nodig heeft. Ze gebruiken twee nieuwe technologieën:

  1. De "Tolken" (De AIRT-VLM Adapter):
    De AI-modellen die we nu hebben (zoals ChatGPT voor beelden) zijn getraind op normale foto's van de wereld: honden, auto's, mensen. Ze begrijpen geen warmtefoto's. Een warmtefoto ziet er voor hen uit als een wazig, grijs rommeltje.
    De auteurs hebben een slimme "Tolken" bedacht. Deze tolk neemt de wazige warmtefoto en vertaalt hem naar een beeld dat de AI wel begrijpt. Hij maakt het beeld scherper, haalt ruis weg en zorgt dat het defect eruit springt, alsof je een wazige foto hebt ingescherpt en de kleuren hebt versterkt.

  2. De "Superlezer" (Vision-Language Models of VLMs):
    Dit zijn de AI-modellen die al heel veel weten over de wereld. Ze kunnen een foto zien en er een tekst bij schrijven, of een tekst lezen en een object in de foto aanwijzen.
    Omdat de "Tolken" het warmtebeeld heeft vertaald naar een beeld dat de "Superlezer" begrijpt, kunnen we nu gewoon tegen de computer zeggen: "Kijk naar deze foto en wijs me aan waar de defecten zitten."
    De computer doet dit direct, zonder dat we hem ooit hebben geleerd wat een defect is. Het is alsof je een expert vraagt om een vreemd document te lezen; hij hoeft het niet te studeren, hij kan het gewoon "voelen" omdat hij zo slim is.

Hoe werkt het in de praktijk?
Stel je voor dat je een lange video hebt van hoe de warmte door de vleugel loopt.

  • Stap 1: De "Tolken" pakt die hele video en knijpt hem samen tot één enkele, superduidelijke foto. In deze foto is het defect als een heldere rode vlek zichtbaar, terwijl de rest van de vleugel rustig grijs is.
  • Stap 2: Deze foto wordt aan de "Superlezer" gegeven met de opdracht: "Zoek de rode vlek."
  • Resultaat: De computer tekent direct een kader om het defect.

Wat zeggen de resultaten?
De onderzoekers hebben dit getest op 25 verschillende vleugels met verschillende soorten schade.

  • De "Tolken" maakte de defecten veel duidelijker zichtbaar dan oude methoden (de "beeldkwaliteit" verbeterde enorm).
  • De "Superlezer" vond de defecten in 70% van de gevallen perfect, zelfs zonder dat hij ooit eerder een defect had gezien.
  • Het kostte geen tijd om de computer te trainen. Je kunt het direct gebruiken.

De beperkingen (Het is niet perfect)
Deze methode is geweldig om te zien waar een defect zit, maar hij kan nog niet zeggen wat het precies is (bijvoorbeeld: "dit is een losse laag" vs. "dit is een gat") of hoe diep het zit. Dat komt omdat de computer de hele video heeft samengeperst tot één foto. Om diepte te meten, moet je nog steeds kijken naar de volledige video. Maar voor het snel vinden van problemen is dit een enorme doorbraak.

Samenvattend:
Dit paper introduceert een manier om AI te gebruiken voor het inspecteren van vliegtuigonderdelen, zonder dat je eerst jarenlang data hoeft te verzamelen en te labelen. Door een slimme "vertaler" te gebruiken, kunnen we bestaande, superslimme AI-modellen vragen om defecten te vinden in warmtefoto's, net zoals ze dat doen met gewone foto's. Het maakt inspectie sneller, goedkoper en makkelijker.