bioinformatics artículos

La bioinformática es el puente vital entre la biología y los datos, transformando secuencias genéticas complejas en conocimiento comprensible que impulsa la medicina moderna y la investigación. En Gist.Science, hacemos que estos avances sean accesibles para todos, eliminando las barreras del lenguaje técnico para que cualquier persona pueda seguir el ritmo de los descubrimientos más recientes.

Cada nuevo preimpreso en esta categoría proviene directamente de bioRxiv, la plataforma líder donde los científicos comparten sus hallazgos antes de la publicación formal. Nuestro equipo procesa cada uno de estos documentos para ofrecer tanto resúmenes técnicos detallados como explicaciones en lenguaje sencillo, garantizando que la información fluya sin complicaciones. A continuación, encontrará los últimos artículos publicados en bioinformática seleccionados para su lectura.

Evaluating Limits of Machine Learning-Assisted Raman Spectroscopy in Classification of Biological Samples

Este estudio concluye que la precisión en la clasificación de muestras biológicas mediante espectroscopía Raman asistida por aprendizaje automático depende principalmente de la calidad de los datos y la similitud espectral, más que del algoritmo utilizado, destacando la necesidad de controlar el ruido experimental, la variabilidad biológica y la calibración instrumental para obtener resultados robustos.

Yadav, A., Birkby, A., Armstrong, N., Arnob, A., Chou, M.-H., Fernandez, A., Verhoef, A. J., Yi, Z., Gulati, S., Kotnis, S., Sun, Q., Kao, K. C., Wu, H.-J.2026-03-01💻 bioinformatics

Information Leakage in Enzyme Substrate Prediction

Este trabajo demuestra que el rendimiento de modelos de aprendizaje profundo populares para predecir la interacción enzima-sustrato está artificialmente inflado debido a fugas de información en el conjunto de datos, lo que provoca que su precisión caiga a niveles aleatorios cuando se eliminan dichas fugas.

Atabaigi Elmi, V., Joeres, R., Kalinina, O. V.2026-03-01💻 bioinformatics

MolX: A Geometric Foundation Model for Protein-Ligand Modelling

MolX es un modelo fundacional basado en transformadores de gráficos E(3)-equivariantes que, al aprender representaciones geométricas y químicas conjuntas de proteínas y ligandos a partir de millones de estructuras 3D, logra un rendimiento superior y una interpretación biológica en la predicción de interacciones moleculares complejas para el descubrimiento de fármacos.

Liu, J., Pan, T., Guo, X., Ran, Z., Hao, Y., Yang, Y., Ng, A. P., Pan, S., Song, J., Li, F.2026-03-01💻 bioinformatics

Achieving spatial multi-omics integration from unaligned serial sections with DIME

El artículo presenta DIME, un marco de aprendizaje profundo que logra la integración de datos multi-ómicos espaciales a partir de secciones seriadas no alineadas mediante una estrategia híbrida de correspondencia global, superando las limitaciones de los métodos existentes que requieren intersección de características.

Sun, P., Huang, X., Mou, T., Zheng, X.2026-02-28💻 bioinformatics

SpatialCompassV (SCOMV): De novo cell and gene spatial pattern classification and spatially differential gene identification

SpatialCompassV (SCOMV) es una herramienta computacional que permite la clasificación no supervisada de patrones espaciales de genes y células, así como la identificación de genes diferencialmente espaciales, mediante el análisis vectorial de sus posiciones relativas a regiones de interés en tejidos tumorales.

Nomura, R., Sakai, S. A., Kageyama, S.-I., Tsuchihara, K., Yamashita, R.2026-02-28💻 bioinformatics

LRSomatic: a highly scalable and robust pipeline for somatic variant calling in long-read sequencing data

LRSomatic es una pipeline escalable y robusta basada en Nextflow diseñada para el análisis integral de variantes somáticas (SNV, indels, variantes estructurales y de número de copias) en datos de secuenciación de lectura larga (PacBio HiFi y ONT), superando las limitaciones actuales de los flujos de trabajo existentes en genómica del cáncer.

Forsyth, R. A., Harbers, L., Verhasselt, A., Iraizos, A.-L. R., Yang, S., Vande Velde, J., Davies, C., Pillay, N., Lambrechts, L., Demeulemeester, J.2026-02-28💻 bioinformatics

Arborist: Prioritizing Bulk DNA Inferred Tumor Phylogenies via Low-pass Single-cell DNA Sequencing Data

El artículo presenta ARBORIST, un método que integra datos de secuenciación de ADN tumoral a granel y de célula única de baja cobertura para priorizar y resolver filogenias tumorales con mayor precisión y confianza.

Weber, L. L., Ching, C. Y., Ly, C., Pan, Y., Cheng, Y., Gao, C., Van Loo, P.2026-02-28💻 bioinformatics

Nanopore sequencing reaches amplicon sequence variant (ASV) resolution

Este estudio demuestra que, gracias a las mejoras recientes en la precisión de Oxford Nanopore Technologies, ahora es posible generar variantes de secuencia de amplicón (ASV) directamente a partir de lecturas crudas para perfiles microbianos complejos, superando la dependencia de bases de datos de referencia y permitiendo la resolución de variantes intragenómicas en rangos de longitud de 250 a 4200 pb.

Riisgaard-Jensen, M., Villanelo, S. A. R., Andersen, K. S., Kirkegaard, R., Hansen, S. H., Jiang, C., Stefansen, A. V., Thomsen, J. H. D., Nielsen, P. H., Dueholm, M. K. D.2026-02-28💻 bioinformatics

ESMRank reveals a transferable axis of protein mutational constraint from overlapping variant effect assays

El estudio presenta ESMRank, un predictor basado en aprendizaje a la clasificación que integra modelos de lenguaje de proteínas y descriptores fisicoquímicos para generar una escala unificada de tolerancia mutacional al alinear datos de ensayos de efecto de variantes superpuestos, logrando así predecir con precisión la patogenicidad y las propiedades funcionales de las variantes proteicas sin necesidad de supervisión clínica.

Arnese, R., Gambardella, G.2026-02-28💻 bioinformatics

Random Matrix Theory-guided sparse PCA for single-cell RNA-seq data

Este trabajo presenta un método de PCA disperso guiado por la teoría de matrices aleatorias, que utiliza un algoritmo de bi-blanqueo para estimar el ruido de forma autónoma y seleccionar el nivel de dispersión óptimo, logrando así una inferencia robusta y casi libre de parámetros que supera a las técnicas actuales en la reducción de dimensionalidad y clasificación de células de datos de ARN de célula única.

Chardes, V.2026-02-28💻 bioinformatics

← Anterior Siguiente →