La bioinformática es el puente vital entre la biología y los datos, transformando secuencias genéticas complejas en conocimiento comprensible que impulsa la medicina moderna y la investigación. En Gist.Science, hacemos que estos avances sean accesibles para todos, eliminando las barreras del lenguaje técnico para que cualquier persona pueda seguir el ritmo de los descubrimientos más recientes.

Cada nuevo preimpreso en esta categoría proviene directamente de bioRxiv, la plataforma líder donde los científicos comparten sus hallazgos antes de la publicación formal. Nuestro equipo procesa cada uno de estos documentos para ofrecer tanto resúmenes técnicos detallados como explicaciones en lenguaje sencillo, garantizando que la información fluya sin complicaciones. A continuación, encontrará los últimos artículos publicados en bioinformática seleccionados para su lectura.

Neurotox: Deep learning decodes conserved hallmarks of neurotoxicity across venomous species

El estudio presenta Neurotox, un marco de aprendizaje profundo basado en secuencias que demuestra que la neurotoxicidad se codifica en características distribuidas de la secuencia de aminoácidos que moldean la organización estructural y la interacción con receptores, en lugar de depender únicamente de residuos de contacto aislados.

Bedraoui, A., El Mejjad, S., Enezari, S., El Hajji, F. Z., Galan, J., El Fatimy, R., Daouda, T.2026-03-10💻 bioinformatics

Counting strands in outer membrane beta-barrels

Este trabajo presenta una actualización del algoritmo PolarBearal que logra un 97% de precisión en la identificación automática del número de hebras en beta-barriles de membrana externa bacteriana, permitiendo el análisis a gran escala de más de 571.000 estructuras predichas por AlphaFold2 para avanzar en la comprensión de la relación estructura-función y el diseño de proteínas.

Lim, S., Nimmagadda, T., Khamis, A., Montezano, D., Feehan, R., Copeland, M., Slusky, J.2026-03-10💻 bioinformatics

PhosSight: a Unified Deep Learning Framework Boosting and Accelerating Phosphoproteome Identification to Enable Biological Discoveries

PhosSight es un marco unificado de aprendizaje profundo que mejora la identificación y acelera el análisis de la fosfoproteómica mediante el uso de características fisicoquímicas específicas para optimizar tanto la adquisición dependiente de datos (DDA) como la independiente (DIA), lo que permite descubrir nuevos objetivos oncológicos como MARK2 en el cáncer de endometrio.

Wang, B., Cheng, Z., She, C., Zhang, J., Lv, L., Zhu, H., Liu, L., Fu, Y., Yi, X.2026-03-10💻 bioinformatics

Inferring large networks with matrix factorisation to capture non-linear dependencies among genes using sparse single-cell profiles

El artículo presenta NIRD, un método basado en factorización matricial y regresión no lineal que infiere redes de dependencias no lineales entre genes a partir de perfiles de transcriptoma de células individuales altamente dispersos, superando a otros enfoques en precisión, robustez ante efectos de lote y capacidad para predecir objetivos directos de factores de transcripción.

Jha, I. P., Meshran, A. G., Kumar, V., Natarajan, K. N., KUMAR, V.2026-03-10💻 bioinformatics

Exploring per-base quality scores as a surrogate marker of cell-free DNA fragmentome

Este estudio demuestra que las puntuaciones de calidad por base en la secuenciación de ADN libre de células pueden servir como un marcador de bajo costo y sin alineación para detectar cáncer, ya que capturan señales fragmentómicas que distinguen eficazmente entre muestras tumorales y controles.

Volkov, H. H. V., Raitses-Gurevich, M., Grad, M., Shlayem, R., Leibowitz, D., Rubinek, T., Golan, T., Shomron, N.2026-03-10💻 bioinformatics

FAMUS: A Few-Shot Learning Framework for Large-Scale Protein Annotation

El artículo presenta FAMUS, un marco de aprendizaje contrastivo de pocos ejemplos que mejora la anotación funcional de proteínas a gran escala al utilizar puntuaciones de similitud completas en lugar de los mejores resultados individuales, superando a herramientas existentes como KofamScan e InterProScan y ofreciendo modelos accesibles para diversas bases de datos de familias proteicas.

Shur, G., Burstein, D.2026-03-10💻 bioinformatics

Developing SCL2205 : A Protein Sequence-based Spatial Modelling Dataset for the Protein Language Model Frontier

Este estudio presenta SCL2205, un conjunto de datos de alta calidad y libre acceso derivado de UniProtKB que, mediante un riguroso preprocesamiento y partición para minimizar la fuga de datos, permite mejorar significativamente el rendimiento de los modelos de aprendizaje profundo para la predicción de la localización subcelular de proteínas en comparación con los métodos actuales.

Ouso, D., Pollastri, G.2026-03-10💻 bioinformatics

Intrinsic dataset features drive mutational effect prediction by protein language models

Este estudio demuestra que el rendimiento de los modelos de lenguaje de proteínas para predecir efectos mutacionales está determinado principalmente por las características intrínsecas de los conjuntos de datos, como la variabilidad de la aptitud, en lugar de la arquitectura del modelo, y revela que muchas evaluaciones actuales sobreestiman el éxito al permitir filtraciones de datos y al no superar a predictores basados simplemente en la aptitud media de los sitios.

Vieira, L. C., Lin, S., Wilke, C. O.2026-03-10💻 bioinformatics

Phosphorylation of a tumor-derived ASXL2 epitope remodels 1 peptide-HLA binding affinity and interaction dynamics

Este estudio demuestra mediante simulaciones de dinámica molecular que la fosforilación de un epítopo derivado de ASXL2 remodela las interacciones no enlazantes y aumenta la flexibilidad conformacional del complejo péptido-HLA, mejorando su afinidad de unión y proporcionando una base estructural para el desarrollo de inmunoterapias dirigidas a epítopos tumorales modificados.

Zhang, J., Lv, L., Chen, B., Yi, X.2026-03-10💻 bioinformatics