Efficient protein structure prediction fromcompact computers to datacenters withOpenFold-TRT

Die Arbeit stellt Beschleunigungen für OpenFold und TensorRT vor, die eine bis zu 131-fach schnellere Proteinstrukturvorhersage im Vergleich zu AlphaFold2 auf verschiedenen Hardware-Plattformen – von kompakten Systemen bis zu Rechenzentren – ohne Genauigkeitsverlust ermöglichen.

Ursprüngliche Autoren: Didi, K., Sohani, P., Berressem, F., Nesterovskiy, A., Fomitchev, B., Ohannessian, R., Elbalkini, M., Cogan, J., Costa, A. B., Vahdat, A., Kallenborn, F., Schmidt, B., Mirdita, M., Steinegger, M., Dal
Veröffentlicht 2026-03-15
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre
⚕️

Dies ist eine KI-generierte Erklärung eines Preprints, das nicht peer-reviewed wurde. Dies ist kein medizinischer Rat. Treffen Sie keine Gesundheitsentscheidungen auf Grundlage dieses Inhalts. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie sind ein Architekt, der versuchen muss, ein riesiges, komplexes Schloss aus nur einer Liste von Buchstaben (der DNA-Sequenz) zu bauen. Das ist im Grunde das, was Wissenschaftler tun, wenn sie die Struktur von Proteinen vorhersagen. Proteine sind die kleinen Baumeister unseres Körpers, und um zu verstehen, wie sie funktionieren, müssen wir wissen, wie sie gefaltet sind.

Bis vor kurzem war dieser Prozess wie das Bauen eines Schlosses mit einem sehr langsamen, alten Werkzeugkasten. Es dauerte Stunden oder sogar Tage, und man brauchte dafür riesige, teure Supercomputer.

Dieser neue Bericht von NVIDIA und Partnern stellt eine revolutionäre Werkzeug-Upgrade vor, das diesen Prozess um das 131-fache beschleunigt. Hier ist die Erklärung, wie das funktioniert, ganz einfach und mit ein paar Bildern:

1. Das alte Problem: Die Bibliothek und der Baumeister

Der Prozess hat zwei Hauptschritte:

  • Schritt A (Die Bibliothek): Zuerst muss man in einer riesigen Bibliothek nach ähnlichen Buchstabenfolgen suchen, um Hinweise zu finden. Das ist wie das Suchen nach alten Bauplänen in einer Bibliothek, die so groß ist wie ein ganzer Kontinent. Bisher war das Suchen in dieser Bibliothek sehr langsam.
  • Schritt B (Der Baumeister): Dann nimmt ein künstlicher Intelligenz-Algorithmus (der "Baumeister") diese Hinweise und baut das 3D-Modell. Auch das war bisher rechenintensiv und langsam.

2. Die Lösung: Ein Turbo-Kit für beide Schritte

Die Forscher haben zwei Hauptwerkzeuge verbessert: MMseqs2 (für die Bibliothek) und OpenFold (für den Baumeister).

Das neue Suchwerkzeug (MMseqs2-GPU)

Stellen Sie sich vor, früher mussten Sie jede einzelne Seite in der riesigen Bibliothek einzeln durchblättern.

  • Die alte Methode: Ein einzelner Bibliothekar (CPU) läuft durch die Gänge.
  • Die neue Methode: Sie haben jetzt einen ganzen Schwarm von Robotern (die GPU), die alle gleichzeitig arbeiten.
  • Der Blackwell-Turbo: Die Forscher haben diese Roboter auf den neuesten NVIDIA-Chips (Blackwell) laufen lassen. Es ist, als hätten sie den Bibliothekar nicht nur durch Roboter ersetzt, sondern sie mit einem Lichtgeschwindigkeits-Schreibsystem ausgestattet. Auf einem Server mit einer einzigen neuen Grafikkarte (RTX PRO 6000) finden sie die Hinweise so schnell, dass es 191-mal schneller ist als die alte Standardmethode.

Der neue Baumeister (OpenFold-TRT)

Jetzt kommt der eigentliche Architekt (die KI).

  • Das alte Werkzeug: Der Architekt arbeitete sehr sorgfältig, aber langsam, weil er jede Berechnung mit extrem hoher Genauigkeit (wie mit einem Mikroskop) durchführte, was viel Zeit kostete.
  • Das neue Werkzeug (TensorRT): Die Forscher haben dem Architekten ein Super-Setzzeug gegeben. Sie haben die Berechnungen so optimiert, dass der Architekt immer noch genau baut, aber jetzt mit einem Turbo-Modus arbeitet. Er nutzt eine spezielle "Misch-Genauigkeit", die schnell ist, aber das Ergebnis nicht verschlechtert.
  • Das Ergebnis: Der Architekt baut das Schloss 20-mal schneller als das alte Modell (AlphaFold2) und 2,5-mal schneller als die bisherige beste Open-Source-Version.

3. Die Hardware: Von der Garage zum Rechenzentrum

Das Tolle an dieser Arbeit ist, dass es nicht nur für riesige Supercomputer funktioniert, sondern auch für kleinere, effizientere Maschinen:

  • Der "Super-Chip" (Grace-Hopper): Stellen Sie sich vor, CPU (das Gehirn) und GPU (die Hände) sind nicht mehr in zwei verschiedenen Räumen, sondern direkt miteinander verbunden, wie ein Gehirn und seine Hände, die sich die Hand reichen. Das ermöglicht es, auch riesige Datenbanken zu durchsuchen, ohne dass der Speicherplatz ausgeht.
  • Der "Mini-Computer" (DGX Spark): Selbst auf einem kleinen, energieeffizienten Gerät, das so groß wie ein Schuhkarton ist, funktioniert das System erstaunlich gut. Es ist wie ein Rennwagen, der auch in der Stadt fährt.

4. Warum ist das wichtig?

Stellen Sie sich vor, Sie wollen 350 Millionen verschiedene Proteine analysieren (wie es die aktuelle Datenbank versucht).

  • Mit den alten Methoden würde das auf einem einzelnen Server 500 Jahre dauern.
  • Mit den neuen Methoden dauert es nur ein halbes Jahr.

Das ist ein riesiger Unterschied. Es bedeutet, dass Wissenschaftler viel schneller neue Medikamente entwickeln, Enzyme für umweltfreundliche Prozesse designen oder verstehen können, wie Krankheiten entstehen.

Zusammenfassung in einem Satz

Die Forscher haben die "Suche" und das "Bauen" von Proteinstrukturen so stark optimiert, dass ein einzelner moderner Server heute so viel Leistung hat wie ein ganzes Rechenzentrum von vor ein paar Jahren – und das alles, ohne dass die Qualität der Ergebnisse leidet. Es ist, als hätten sie aus einem langsamen Fahrrad ein Formel-1-Auto gemacht, das trotzdem sicher fährt.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →