Molecular Fingerprints Are Strong Models for Peptide Function Prediction

Die Studie widerlegt die Annahme, dass für die Vorhersage von Peptidfunktionen komplexe Modelle zur Erfassung langreichweitiger Wechselwirkungen notwendig sind, und zeigt, dass einfache, lokale molekulare Fingerabdrücke in Kombination mit LightGBM auf 132 Datensätzen State-of-the-Art-Ergebnisse erzielen, die fortschrittliche Graph-Neural-Networks und Transformer-Modelle übertreffen.

Jakub Adamczyk, Piotr Ludynia, Wojciech CzechWed, 11 Ma🤖 cs.LG

Representing local protein environments with machine learning force fields

Diese Arbeit stellt eine neuartige Repräsentation lokaler Proteinumgebungen vor, die auf Zwischenschichten atomarer Grundmodelle basiert und nicht nur Struktur- und chemische Merkmale präzise erfasst, sondern auch den Aufbau datengesteuerter Priors sowie die Entwicklung eines hochpräzisen, physikbasierten Vorhersagemodells für NMR-Chemische Verschiebungen ermöglicht.

Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Anar Rzayev, Federico Napoli, Paul Schanda, Alex M. BronsteinTue, 10 Ma💻 cs

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

CryoNet.Refine ist ein auf einem einstufigen Diffusionsmodell basierendes Deep-Learning-Framework, das die automatische und schnelle Verfeinerung von Protein- sowie DNA/RNA-Protein-Komplexen mittels Cryo-EM-Dichtekarten ermöglicht und dabei sowohl die Übereinstimmung mit den experimentellen Daten als auch die geometrische Qualität gegenüber herkömmlichen Methoden wie Phenix.real_space_refine signifikant verbessert.

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff ZhangTue, 10 Ma💻 cs

Reverse Distillation: Consistently Scaling Protein Language Model Representations

Die Arbeit stellt Reverse Distillation vor, ein Framework, das Protein-Sprachmodelle durch die Zerlegung ihrer Repräsentationen in orthogonale Unterräume so optimiert, dass größere Modelle konsistent besser abschneiden als kleinere, indem sie die von kleineren Modellen erlernten allgemeinen Merkmale bewahren und zusätzliche Informationen orthogonal hinzufügen.

Darius Catrina, Christian Bepler, Samuel Sledzieski, Rohit SinghTue, 10 Ma🤖 cs.LG

A thermodynamic metric quantitatively predicts disordered protein partitioning and multicomponent phase behavior

Diese Studie stellt ein thermodynamisches Modell vor, das durch das Erlernen kontextunabhängiger Sequenzdarstellungen die Phasentrennung und Verteilung intrinsisch ungeordneter Proteinregionen in komplexen Mischungen quantitativ vorhersagt und dabei eine einheitliche, interpretierbare Grundlage für das Verständnis biomolekularer Kondensate bietet.

Zhuang Liu, Beijia Yuan, Mihir Rao, Gautam Reddy, William M. JacobsTue, 10 Ma🔬 cond-mat.mtrl-sci

BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design

Das Paper stellt BInD vor, einen diffusionsbasierten Generierungsmodellansatz für das strukturabhängige Wirkstoffdesign, der durch wissensbasierte Führung Moleküle und ihre Wechselwirkungen mit Zielproteinen gemeinsam erzeugt, um eine ausgewogene Optimierung mehrerer Ziele wie Bindungsspezifität, Moleküleigenschaften und lokale Geometrie zu erreichen.

Joongwon Lee, Wonho Zhung, Jisu Seo, Woo Youn KimMon, 09 Ma🤖 cs.LG

Quantifying Cross-Attention Interaction in Transformers for Interpreting TCR-pMHC Binding

Die Arbeit stellt QCAI vor, eine neue post-hoc-Methode zur Interpretation von Cross-Attention-Mechanismen in Transformer-Decodern für TCR-pMHC-Bindungen, die mit dem neu eingeführten TCR-XAI-Benchmark aus 274 experimentellen Strukturen sowohl die Interpretierbarkeit als auch die Vorhersagegenauigkeit verbessert.

Jiarui Li, Zixiang Yin, Haley Smith, Zhengming Ding, Samuel J. Landry, Ramgopal R. MettuMon, 09 Ma🤖 cs.LG

Sampling-based Continuous Optimization for Messenger RNA Design

Die Autoren stellen ein generalisiertes, sampling-basiertes kontinuierliches Optimierungsframework vor, das durch iteratives Erzeugen und Bewerten synonym codierender mRNA-Sequenzen unter Verwendung von Black-Box-Metriken effizientere Designs für Stabilität und Leistung im Vergleich zu bestehenden Methoden wie LinearDesign und EnsembleDesign ermöglicht.

Feipeng Yue, Ning Dai, Wei Yu Tang, Tianshuo Zhou, David H. Mathews, Liang HuangMon, 09 Ma🧬 q-bio

The role of topology on protein thermal stability

Diese Studie zeigt durch Monte-Carlo-Simulationen, dass die thermische Stabilität des geknoteten Proteins YibK nicht von dessen Topologie abhängt und dass die Diskrepanz zwischen experimentellen und computergestützten Ergebnissen auf einer starken Trennung der Zeitskalen für das Entknoten und Entfalten beruht, die dazu führt, dass DSC-Experimente oft einen Nicht-Gleichgewichtszustand erfassen.

João N. C. Especial, Beatriz P. Teixeira, Ana Nunes, Miguel Machuqueiro, Patrícia F. N. FaíscaFri, 13 Ma🧬 q-bio

Preservation Constraints on aDNA Information Generation and the HSF Posterior Sourcing Framework: A First-Principles Critique of Conventional Methods

Dieser Artikel stellt das HSF-Rahmenwerk vor, das durch eine first-principles-Analyse der Erhaltungszustände und eine neue Klassifizierung von DNA-Fragmenten konventionelle aDNA-Methoden kritisiert, um Verzerrungen bei der Quellenzuordnung in komplexen, gemischten Proben zu reduzieren und die Zuverlässigkeit der molekularen Archäologie zu erhöhen.

Wan-Qian Zhao, Shu-Jie Zhang, Zhan-Yong Guo + 1 more2026-03-10🧬 q-bio

Inference-time optimization for experiment-grounded protein ensemble generation

Die vorgestellte Arbeit führt ein generisches Optimierungsframework zur Inferenzzeit ein, das durch die direkte Optimierung latenter Repräsentationen und neuartiger Boltzmann-gewichteter Stichprobenverfahren experimentell fundierte Protein-Ensembles erzeugt, die physikalisch plausibler sind und besser mit experimentellen Daten übereinstimmen als bestehende Methoden, während sie gleichzeitig eine Anfälligkeit aktueller Konfidenzmetriken aufdecken.

Advaith Maddipatla, Anar Rzayev, Marco Pegoraro + 5 more2026-03-06💻 cs

FLOWR.root: A flow matching based foundation model for joint multi-purpose structure-aware 3D ligand generation and affinity prediction

FLOWR.root ist ein SE(3)-äquivarianter Flow-Matching-Grundlagenmodell, das die strukturbewusste 3D-Generierung von Liganden mit der Vorhersage von Bindungsaffinität und Konfidenzschätzung vereint und durch effizientes Fine-Tuning sowie Inferenz-Skalierung einen umfassenden Ansatz für den strukturbasierten Wirkstoffentwurf von der Hit-Identifizierung bis zur Leitstrukturoptimierung bietet.

Julian Cremer, Tuan Le, Mohammad M. Ghahremanpour + 3 more2026-03-05🤖 cs.LG

Cryo-SWAN: the Multi-Scale Wavelet-decomposition-inspired Autoencoder Network for molecular density representation of molecular volumes

Das Paper stellt Cryo-SWAN vor, ein auf der Multi-Scale-Wavelet-Zerlegung basierendes Autoencoder-Netzwerk, das durch konditionale, grob-zu-fein verlaufende latente Kodierung und rekursive Residual-Quantisierung robuste Repräsentationen für molekulare Dichtevolumen erzeugt und damit die Rekonstruktionsqualität sowie die generative Modellierung in der strukturellen Biologie verbessert.

Rui Li, Artsemi Yushkevich, Mikhail Kudryashev + 1 more2026-03-05🤖 cs.AI