Die Bioinformatik verbindet Biologie und Informatik, um riesige Mengen an biologischen Daten verständlich zu machen. Statt sich nur auf einzelne Experimente zu konzentrieren, nutzen Forscher hier computergestützte Methoden, um Muster im Leben selbst zu entschlüsseln, von der DNA bis zu komplexen Krankheitsverläufen. Diese Schnittstelle ermöglicht es, die Sprache des Lebens in Zahlen und Algorithmen zu übersetzen und neue Erkenntnisse schnell zu gewinnen.

Auf Gist.Science durchsuchen wir täglich die neuesten Vorab-Veröffentlichungen auf bioRxiv in diesem Bereich. Für jedes neu eingereichte Preprint erstellen wir nicht nur eine detaillierte technische Zusammenfassung für Fachleute, sondern auch eine einfache Erklärung in Alltagssprache, damit jeder den Kern der Forschung verstehen kann. So wird komplexes Wissen für ein breites Publikum zugänglich, ohne dass wichtige Details verloren gehen.

Unten finden Sie die aktuellsten Artikel aus dem Bereich der Bioinformatik, die wir kürzlich für Sie aufbereitet haben.

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

Diese Studie vergleicht die Leistung von 29 maschinellen Lernalgorithmen, 80 Deep-Learning-Modellen und drei polygenen Risikoscore-Tools bei der Vorhersage von 80 binären Phänotypen aus dem openSNP-Datensatz und zeigt, dass maschinelle Lernverfahren bei 44 und polygene Risikoscores bei 36 Phänotypen die besseren Ergebnisse lieferten.

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics

MapMyCells: High-performance mapping of unlabeled cell-by-gene data to reference brain taxonomies

MapMyCells ist ein Open-Source-Framework, das eine effiziente, hardwareunabhängige und modality-agnostische Zuordnung ungelabelter Einzelzell-Datensätze zu hierarchischen Referenz-Taxonomien des Gehirns ermöglicht, um eine reproduzierbare Annotation und die Integration von Studien über verschiedene Spezies und molekulare Assays hinweg zu unterstützen.

Daniel, S. F., Lee, C., Mollenkopf, T., Lee, M., Arbuckle, J., Fiabane, E., Gabitto, M. I., Johansen, N., Kapen, I., Kraft, A. W., Lai, J., Li, S. Y., McGinty, R., Miller, J. A., Welch-Moosman, S., Ot (…)2026-03-09💻 bioinformatics

Multi-Modal Protein Representation Learning with CLASP

Das Paper stellt CLASP vor, ein einheitliches dreimodales Framework, das geometrisches Deep Learning, große Sprachmodelle und Protein-Sprachmodelle kombiniert, um durch die Integration von Struktur-, Sequenz- und Textdaten aussagekräftige Protein-Repräsentationen zu lernen, die bei Null-Shot-Klassifizierungs- und Retrieval-Aufgaben sowie beim Clustering nach Protein-Familien den aktuellen Stand der Technik übertreffen.

Bolouri, N., Szymborski, J., Emad, A.2026-03-08💻 bioinformatics

anndataR improves interoperability between R and Python in single-cell transcriptomics

Das R-Paket anndataR verbessert die Interoperabilität zwischen R und Python in der Einzelzell-Transkriptomik, indem es den naiven Lese- und Schreibzugriff auf H5AD-Dateien sowie die Konvertierung zu und von SingleCellExperiment- oder Seurat-Objekten ermöglicht.

Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.2026-03-08💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

Diese Studie stellt einen verbesserten und standardisierten Datensatz mit doppelt so vielen kuratierten Wirt-Virus-Daten vor, der zeigt, dass die Vorhersage von Wirtsinfektionen auf genetischer Ebene auf höheren taxonomischen Ebenen (z. B. Säugetiere) zuverlässiger ist als für spezifische Arten wie den Menschen, während die Generalisierungsfähigkeit auf völlig neue, nicht verwandte Viren weiterhin eine große Herausforderung bleibt.

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

MiRformer: A Unified Generative Framework for mRNA-Conditioned miRNA Synthesis and Interaction Prediction

Die Arbeit stellt MiRformer vor, ein einheitliches generatives Framework auf Basis von Dual-Transformern, das durch die direkte Modellierung von Rohsequenzen und die Verwendung eines gleitenden Fenster-Attention-Mechanismus präzise miRNA-mRNA-Interaktionen vorhersagt, Bindungsstellen lokalisiert und biologisch plausible, zielgerichtete miRNA-Sequenzen synthetisiert.

Gu, J., Chen, C., Li, Y.2026-03-08💻 bioinformatics

The Stochastic System Identification Toolkit (SSIT) to model, fit, predict, and design experiments

Das Paper stellt das Stochastic System Identification Toolkit (SSIT) vor, eine schnelle und flexible Open-Source-MATLAB-Software, die es Forschern ermöglicht, stochastische biologische Systeme zu modellieren, Parameter unter Berücksichtigung von Rauschen und Messfehlern zu schätzen, Sensitivitätsanalysen durchzuführen und Experimente quantitativ zu optimieren, um Zeit und Ressourcen zu sparen.

Popinga, A. N., Forman, J., Svetlov, D., Vo, H. D., Munsky, B. E.2026-03-08💻 bioinformatics

HP2NET: Empowering Efficient Phylogenetic Network Analysis through High-Performance Computing

Das Paper stellt HP2NET vor, ein Hochleistungsrechner-Framework, das durch die Integration von fünf PhyloNet-basierten Workflows, Aufgabenverpackung und Datenwiederverwendung die effiziente, skalierbare und reproduzierbare Analyse phylogenetischer Netzwerke ermöglicht, was durch eine bis zu 90,96%ige Reduzierung der Laufzeit und eine erfolgreiche Anwendung auf Dengue-Virus-Genome belegt wird.

Terra, R., Carvalho, D., Machado, D. J., Osthoff, C., Ocana, K.2026-03-08💻 bioinformatics

MS-BCR-DB: an integrated BCR repertoire database to mine humoral multiple sclerosis signatures

Die Studie stellt die MS-BCR-Database vor, eine erste öffentlich zugängliche und einheitlich verarbeitete Datenbank für B-Zell-Rezeptor-Sequenzen bei Multipler Sklerose, die durch die Integration heterogener Datensätze neue Einblicke in krankheitsassoziierte Muster, virale und autoimmunologische Verbindungen sowie potenzielle Biomarker ermöglicht.

Ballerini, C., Cardente, N., Abbate, M. F., Le Quy, K., Rincon, N., Wolfram, L., Lossius, A., Portaccio, E., Amato, M. P., Ballerini, C., Greiff, V.2026-03-08💻 bioinformatics