Controllable Sequence Editing for Biological and Clinical Trajectories

Das Paper stellt CLEF vor, ein Modell zur kontrollierten Sequenzbearbeitung, das in biologischen und klinischen Kontexten gezielte Eingriffe zu spezifischen Zeitpunkten und auf ausgewählte Variablen ermöglicht, wodurch es die Genauigkeit bei der Erzeugung realistischer kontrafaktischer Trajektorien im Vergleich zu bestehenden Methoden erheblich verbessert.

Michelle M. Li, Kevin Li, Yasha Ektefaie, Ying Jin, Yepeng Huang, Shvat Messica, Tianxi Cai, Marinka ZitnikTue, 10 Ma🤖 cs.LG

Adversarial Domain Adaptation Enables Knowledge Transfer Across Heterogeneous RNA-Seq Datasets

Diese Studie stellt ein tiefes Lern-Framework zur adversariellen Domänenanpassung vor, das durch den Erwerb eines domäneninvarianten latenten Raums eine effektive Wissensübertragung von großen auf kleine RNA-Seq-Datensätze ermöglicht und so die Genauigkeit der Krebs- und Gewebetypklassifizierung insbesondere bei Datenknappheit verbessert.

Kevin Dradjat, Massinissa Hamidi, Blaise HanczarTue, 10 Ma🤖 cs.LG

Controlling the joint local false discovery rate is more powerful than meta-analysis methods in joint analysis of summary statistics from multiple genome-wide association studies

Die vorgestellte Studie demonstriert, dass eine neuartige Methode zur gemeinsamen Analyse von GWAS-Zusammenfassungsstatistiken auf Basis der Kontrolle der gemeinsamen lokalen Falsch-Entdeckungsrate (Jlfdr) sowohl in Simulationen als auch bei empirischen Daten eine höhere statistische Power aufweist als herkömmliche Meta-Analyse-Verfahren, insbesondere bei heterogenen Datensätzen.

Wei Jiang, Weichuan YuThu, 12 Ma📊 stat

pHapCompass: Probabilistic Assembly and Uncertainty Quantification of Polyploid Haplotype Phase

Die Studie stellt pHapCompass vor, einen probabilistischen Algorithmus zur Haplotyp-Assemblierung polyploider Genome, der die Unsicherheit bei der Zuordnung von Sequenzreads explizit modelliert, eine realistische Simulationsumgebung für Polyploide entwickelt und durch Benchmarks eine wettbewerbsfähige Leistung bei gleichzeitiger präziser Quantifizierung der Phasenunsicherheit nachweist.

Marjan Hosseini (School of Computing, University of Connecticut), Ella Veiner (School of Computing, University of Connecticut), Thomas Bergendahl (School of Computing, University of Connecticut), Tala Yasenpoor (School of Computing, University of Connecticut), Zane Smith (Department of Entomology and Plant Pathology, University of Tennessee), Margaret Staton (Department of Entomology and Plant Pathology, University of Tennessee), Derek Aguiar (School of Computing, University of Connecticut, Institute for Systems Genomics, University of Connecticut)Thu, 12 Ma🧬 q-bio

Discovery of a Hematopoietic Manifold in scGPT Yields a Method for Extracting Performant Algorithms from Biological Foundation Model Internals

Die Studie präsentiert eine dreistufige Methode zur Extraktion eines kompakten, hochleistungsfähigen hämatopoetischen Algorithmus aus dem Foundation-Modell scGPT mittels mechanischer Interpretierbarkeit, der ohne erneutes Training des Ziel-Datensatzes die Leistung bestehender Methoden übertrifft und biologisch interpretierbare Genprogramme offenbart.

Ihor KendiukhovThu, 12 Ma🧬 q-bio

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

Das Paper stellt SNPgen vor, ein zweistufiges, phänotypüberwachtes latentes Diffusionsmodell, das synthetische Genotypdaten erzeugt, die sowohl die genetische Struktur und Privatsphäre der Originaldaten bewahren als auch in Vorhersageaufgaben die Leistung realer Daten erreichen.

Andrea Lampis, Michela Carlotta Massi, Nicola Pirastu, Francesca Ieva, Matteo Matteucci, Emanuele Di AngelantonioThu, 12 Ma🧬 q-bio

TrinityDNA: A Bio-Inspired Foundational Model for Efficient Long-Sequence DNA Modeling

Die Arbeit stellt TrinityDNA vor, ein bio-inspiriertes Grundmodell, das durch die Integration biologisch fundierter Komponenten wie Groove Fusion und Gated Reverse Complement sowie eines mehrskaligen Aufmerksamkeitsmechanismus effiziente und präzise Modellierungen langer DNA-Sequenzen ermöglicht und damit die Genomforschung voranbringt.

Qirong Yang, Yucheng Guo, Zicheng Liu, Yujie Yang, Qijin Yin, Siyuan Li, Shaomin Ji, Linlin Chao, Xiaoming Zhang, Stan Z. LiMon, 09 Ma💻 cs

Machine Learning for analysis of Multiple Sclerosis cross-tissue bulk and single-cell transcriptomics data

Diese Studie entwickelt einen erklärbaren Machine-Learning-Pipeline, der Bulk- und Single-Cell-Transkriptomdaten aus Blut und Liquor integriert, um Multiple-Sklerose-Patienten präzise zu klassifizieren und durch SHAP-Analysen sowie Netzwerkanalysen neue pathogene Mechanismen und Biomarker wie nicht-kanonische Immun-Checkpoints und EBV-bezogene Signalwege aufzudecken.

Francesco Massafra, Samuele Punzo, Silvia Giulia Galfré, Alessandro Maglione, Simone Pernice, Stefano Forti, Simona Rolla, Marco Beccuti, Marinella Clerico, Corrado Priami, Alina SîrbuMon, 09 Ma🤖 cs.LG