AlphaFind v2: Similarity Search in AlphaFold DB and TED Domains across Structural Contexts

Deze paper introduceert AlphaFind v2, een snelle applicatie voor het zoeken naar structureel vergelijkbare eiwitten in de AlphaFold-database en TED-domeinen, die gebruikmaakt van eiwit-embeddings en US-align om grote datasets te doorzoeken met behoud van biologische relevantie en ondersteuning voor diverse zoekmodi.

Oorspronkelijke auteurs: Slaninakova, T., Rosinec, A., Cillik, J., Krenek, A., Gresova, K., Porubska, J., Marsalkova, E., Olha, J., Prochazka, D., Hejtmanek, L., Dohnal, V., Berka, K., Svobodova, R., Antol, M.

Gepubliceerd 2026-03-12
📖 4 min leestijd☕ Koffiepauze-leesvoer
⚕️

Dit is een AI-gegenereerde uitleg van een preprint die niet peer-reviewed is. Dit is geen medisch advies. Neem geen gezondheidsbeslissingen op basis van deze inhoud. Lees de volledige disclaimer

Each language version is independently generated for its own context, not a direct translation.

AlphaFind v2: De Super-Boekhouder van de Proteïne-Wereld

Stel je voor dat de wereld van de biologie een gigantische bibliotheek is. In deze bibliotheek staan niet gewoon boeken, maar proteïnen. Proteïnen zijn de kleine machines in ons lichaam die alles doen: van het verteren van eten tot het laten bewegen van je spieren.

Vroeger hadden wetenschappers maar een paar duizend "boeken" (experimenteel vastgestelde structuren) in hun bibliotheek. Maar dankzij de kunstmatige intelligentie AlphaFold is deze bibliotheek nu explosief gegroeid naar 240 miljoen boeken! Dat is meer dan alle boeken in de grootste bibliotheken van de wereld bij elkaar.

Het probleem? Als je in een bibliotheek met 240 miljoen boeken zoekt naar één specifiek boek, kun je niet alles één voor één bekijken. Dat zou eeuwen duren. En als je probeert te kijken of twee boeken op elkaar lijken door ze letterlijk naast elkaar te houden (3D-vergelijking), is dat zo'n zware taak dat je computer er van in rook opgaat.

Hier komt AlphaFind v2 om de hoek kijken. Het is als een super-snel, slim zoekmachine voor deze gigantische bibliotheek.

Hoe werkt het? (De Analogie van de "Snelle Schatting" en de "Gedetailleerde Controle")

AlphaFind v2 werkt in twee stappen, net zoals een slimme detective:

  1. De Snelle Schatting (De "Voorverkeuring"):
    Stel je voor dat je op zoek bent naar een boek over "ruimteschepen". In plaats van elke pagina van 240 miljoen boeken te lezen, kijkt de detective eerst alleen naar de kaft en de samenvatting.

    • AlphaFind gebruikt een slimme technologie (zogenoemde "embeddings") die een proteïne omzet in een soort digitale vingerafdruk.
    • De computer kijkt heel snel naar deze vingerafdrukken en zegt: "Hé, deze 100 boeken lijken qua kaft wel erg op wat je zoekt!"
    • Dit gaat razendsnel, binnen een paar seconden.
  2. De Gedetailleerde Controle (De "Nauwkeurige Vergelijking"):
    Nu heeft de detective 100 kandidaten. Maar een kaft kan bedriegen. Dus gaat hij nu echt de boeken openen en de tekst vergelijken.

    • AlphaFind neemt de 100 beste kandidaten en doet een nauwkeurige 3D-vergelijking.
    • Het kijkt precies hoe de vorm van het proteïne eruitziet, net als een architect die twee gebouwen naast elkaar zet om te zien of ze hetzelfde ontwerp hebben.
    • Dit duurt iets langer, maar het geeft je het echte, betrouwbare antwoord.

De Nieuwe Trucs in Versie 2

De vorige versie van AlphaFind was al goed, maar versie 2 heeft nu vier nieuwe "superkrachten":

  • 1. De "Alles-in-één" Zoekopdracht: Je zoekt op het hele proteïne, zoals een heel boek.
  • 2. De "Slechte Kwaliteit" Filter (pLDDT): Soms is een proteïne in de computervoorspelling niet helemaal duidelijk (alsof een pagina in een boek vervaagd is). AlphaFind kan nu zeggen: "Negeer die vervaagde pagina's, ik wil alleen kijken naar de delen die 100% scherp en betrouwbaar zijn." Zo vind je betere matches, zelfs als het proteïne gedeeltelijk onzeker is.
  • 3. De "Hoofdstukken" Zoekopdracht (TED): Proteïnen bestaan vaak uit verschillende bouwstenen (domeinen), net als een boek dat uit verschillende hoofdstukken bestaat. Soms wil je niet het hele boek vergelijken, maar alleen het hoofdstuk over "ruimtevaart". AlphaFind kan nu zoeken op die specifieke bouwstenen.
  • 4. De "Meerdere Hoofdstukken" Zoekopdracht: Dit is de coolste truc. Stel je hebt een boek met een heel specifiek patroon van hoofdstukken: eerst een hoofdstuk over "vissen", dan een over "vliegen", en dan weer over "zwemmen". AlphaFind kan zoeken naar andere boeken die exact diezelfde volgorde van hoofdstukken hebben, zelfs als de rest van het boek anders is.

Waarom is dit geweldig? (Een Voorbeeld)

Stel je voor dat je een plant onderzoekt die een heel lang, warrig haar heeft (een ongestructureerd stuk proteïne). Als je probeert te zoeken naar een gelijke plant, ziet de computer dat lange haar en denkt: "Dat lijkt nergens op!" en geeft je geen resultaten.

Met AlphaFind v2 kun je zeggen: "Negeer dat warrige haar, ik wil alleen kijken naar de sterke, stabiele wortels." Plotseling zie je dat er wel degelijk een heel gelijke plant is, maar dan in een andere soort. Dit helpt wetenschappers om te begrijpen hoe planten groeien en zich aanpassen.

Conclusie

AlphaFind v2 is als een slimme, snelle bibliothecaris die je helpt om de zee van 240 miljoen proteïnen te doorkruisen. Het maakt het mogelijk om in seconden te vinden welke bouwstenen in het leven op elkaar lijken, zelfs als ze heel groot en complex zijn.

Het is gratis, werkt in je browser, en helpt wetenschappers om sneller nieuwe medicijnen te vinden, ziektes te begrijpen en de geheimen van het leven te ontrafelen. Klinkt als een boek dat je zelf moet lezen, toch? Je kunt het hier vinden: https://alphafind.ics.muni.cz/.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →