La bioinformática es el puente vital entre la biología y los datos, transformando secuencias genéticas complejas en conocimiento comprensible que impulsa la medicina moderna y la investigación. En Gist.Science, hacemos que estos avances sean accesibles para todos, eliminando las barreras del lenguaje técnico para que cualquier persona pueda seguir el ritmo de los descubrimientos más recientes.

Cada nuevo preimpreso en esta categoría proviene directamente de bioRxiv, la plataforma líder donde los científicos comparten sus hallazgos antes de la publicación formal. Nuestro equipo procesa cada uno de estos documentos para ofrecer tanto resúmenes técnicos detallados como explicaciones en lenguaje sencillo, garantizando que la información fluya sin complicaciones. A continuación, encontrará los últimos artículos publicados en bioinformática seleccionados para su lectura.

Benchmarking 80 binary phenotypes from the openSNP dataset using deep learning algorithms and polygenic risk score tools

Este estudio compara el rendimiento de algoritmos de aprendizaje automático, aprendizaje profundo y herramientas de puntuación de riesgo poligénico en la predicción de 80 fenotipos binarios del conjunto de datos openSNP, revelando que los métodos de aprendizaje automático superaron a las herramientas tradicionales en 44 fenotipos, mientras que estas últimas fueron más efectivas en 36.

Muneeb, M. -, Ascher, D., Myung, Y., Feng, S., Henschel, A.2026-03-09💻 bioinformatics

MapMyCells: High-performance mapping of unlabeled cell-by-gene data to reference brain taxonomies

MapMyCells es un marco de código abierto de alto rendimiento que permite mapear eficientemente datos de células individuales no etiquetados a taxonomías de referencia jerárquicas del cerebro, facilitando la anotación reproducible y la integración de conjuntos de datos diversos sin necesidad de hardware especializado.

Daniel, S. F., Lee, C., Mollenkopf, T., Lee, M., Arbuckle, J., Fiabane, E., Gabitto, M. I., Johansen, N., Kapen, I., Kraft, A. W., Lai, J., Li, S. Y., McGinty, R., Miller, J. A., Welch-Moosman, S., Ot (…)2026-03-09💻 bioinformatics

Multi-Modal Protein Representation Learning with CLASP

El artículo presenta CLASP, un marco unificado de aprendizaje multimodal que integra modelos de lenguaje de proteínas, aprendizaje profundo geométrico y modelos de lenguaje natural mediante aprendizaje contrastivo para generar representaciones de proteínas superiores que combinan secuencia, estructura y descripciones bioquímicas, logrando un rendimiento destacado en tareas de clasificación y recuperación sin supervisión.

Bolouri, N., Szymborski, J., Emad, A.2026-03-08💻 bioinformatics

anndataR improves interoperability between R and Python in single-cell transcriptomics

El paquete anndataR mejora la interoperabilidad entre R y Python en la transcriptómica de células individuales al permitir la lectura y escritura nativa de archivos H5AD, así como la conversión directa a objetos SingleCellExperiment o Seurat, garantizando la compatibilidad a largo plazo entre ambos lenguajes.

Deconinck, L., Zappia, L., Cannoodt, R., Morgan, M., scverse core,, Virshup, I., Sang-aram, C., Bredikhin, D., Seurinck, R., Saeys, Y.2026-03-08💻 bioinformatics

An Improved Dataset for Predicting Mammal Infecting Viruses from Genetic Sequence Information

Este estudio presenta un conjunto de datos estandarizado y mejorado, con el doble de registros de interacciones virus-hospedador, para evaluar modelos de aprendizaje automático que predicen la infección viral en mamíferos y humanos, revelando que la precisión es mayor en rangos taxonómicos más amplios y en escenarios con menor distancia filogenética, mientras que la generalización a familias virales completamente nuevas sigue siendo un desafío significativo.

Reddy, T., Schneider, A., Hall, A. R., Witmer, A., Hengartner, N.2026-03-08💻 bioinformatics

MiRformer: A Unified Generative Framework for mRNA-Conditioned miRNA Synthesis and Interaction Prediction

El artículo presenta MiRformer, un marco generativo unificado basado en arquitecturas de transformadores que predice con alta precisión las interacciones y sitios de unión entre miARN y ARNm largos, además de sintetizar secuencias de miARN específicas condicionadas por el ARNm, ofreciendo al mismo tiempo una fuerte interpretabilidad biológica.

Gu, J., Chen, C., Li, Y.2026-03-08💻 bioinformatics

The Stochastic System Identification Toolkit (SSIT) to model, fit, predict, and design experiments

El artículo presenta el Toolkit de Identificación de Sistemas Estocásticos (SSIT), una herramienta de software de código abierto en MATLAB diseñada para modelar, ajustar, predecir y optimizar el diseño de experimentos en sistemas biológicos ruidosos mediante métodos probabilísticos avanzados, como se demuestra en estudios de levadura y células cancerosas.

Popinga, A. N., Forman, J., Svetlov, D., Vo, H. D., Munsky, B. E.2026-03-08💻 bioinformatics

HP2NET: Empowering Efficient Phylogenetic Network Analysis through High-Performance Computing

El artículo presenta HP2NET, un marco de trabajo basado en computación de alto rendimiento que automatiza y optimiza el análisis de redes filogenéticas mediante la integración de cinco flujos de trabajo paralelos, logrando reducciones significativas en el tiempo de ejecución y validando su eficacia en el estudio de genomas del virus del dengue.

Terra, R., Carvalho, D., Machado, D. J., Osthoff, C., Ocana, K.2026-03-08💻 bioinformatics

MS-BCR-DB: an integrated BCR repertoire database to mine humoral multiple sclerosis signatures

El artículo presenta MS-BCR-DB, la primera base de datos pública y uniformemente procesada de repertorios de receptores de células B en esclerosis múltiple, que integra datos heterogéneos para identificar firmas inmunológicas asociadas a la enfermedad, como expansiones oligoclonales y clonotipos convergentes dirigidos contra antígenos virales y autoantígenos del sistema nervioso central.

Ballerini, C., Cardente, N., Abbate, M. F., Le Quy, K., Rincon, N., Wolfram, L., Lossius, A., Portaccio, E., Amato, M. P., Ballerini, C., Greiff, V.2026-03-08💻 bioinformatics