La bioinformática es el puente vital entre la biología y los datos, transformando secuencias genéticas complejas en conocimiento comprensible que impulsa la medicina moderna y la investigación. En Gist.Science, hacemos que estos avances sean accesibles para todos, eliminando las barreras del lenguaje técnico para que cualquier persona pueda seguir el ritmo de los descubrimientos más recientes.

Cada nuevo preimpreso en esta categoría proviene directamente de bioRxiv, la plataforma líder donde los científicos comparten sus hallazgos antes de la publicación formal. Nuestro equipo procesa cada uno de estos documentos para ofrecer tanto resúmenes técnicos detallados como explicaciones en lenguaje sencillo, garantizando que la información fluya sin complicaciones. A continuación, encontrará los últimos artículos publicados en bioinformática seleccionados para su lectura.

BTEXgenie: A curated and user-friendly tool for profile HMM-based substrate-specific annotation of BTEX degradation genes

BTEXgenie es una herramienta curada y fácil de usar que utiliza modelos ocultos de Markov de perfiles personalizados para lograr una sensibilidad significativamente mayor que las bases de datos existentes en la detección de genes específicos de sustrato involucrados en la degradación aeróbica y anaeróbica de BTEX, al tiempo que proporciona visualizaciones integradas de vías y genómicas para estudios genómicos ambientales y comparativos.

Qu, J., Garber, A. I., Armbruster, C. R.2026-05-15💻 bioinformatics

TDP-43 regulates chromatin looping and gene transcription through binding and stabilizing DNA G-quadruplex structures

Este estudio revela que TDP-43 regula la transcripción génica y facilita el plegamiento de la cromatina a larga distancia al unirse y estabilizar estructuras de G-cuádruplex de ADN en los anclajes de los bucles de cromatina, proporcionando así una explicación mecanicista para la desregulación génica en enfermedades asociadas a la disfunción de TDP-43.

Yang, F., Zhang, S., Guo, X., Qiao, Y., Zhang, Y., Sun, H., Chen, X., Wang, H.2026-05-15💻 bioinformatics

A modular Bayesian framework for inferring transmission networks from polyclonal infections, with application to Plasmodium falciparum

Este artículo presenta un marco bayesiano modular, ejemplificado por el software Plasmotrack para *Plasmodium falciparum*, que reconstruye redes de transmisión dirigidas a partir de infecciones policlonales al acomodar múltiples fuentes genéticas y padres no observados para estimar métricas clave de salud pública.

Murphy, M. R., Nielsen, R., Perkins, A., Greenhouse, B.2026-05-15💻 bioinformatics

Viral non-coding RNA structure annotation and API-based data retrieval with Rfam and R2DT

Este artículo presenta protocolos computacionales y ejemplos prácticos para automatizar la anotación de ARN no codificantes virales y recuperar datos de Rfam programáticamente mediante su API RESTful, al tiempo que aprovecha R2DT para generar visualizaciones integrales de estructuras 2D destinadas a su integración en flujos de trabajo de bioinformática y aprendizaje automático.

Muston, P., Triebel, S., Nawrocki, E., Ontiveros-Palacios, N., Jandalala, I., Sweeney, B., Bateman, A., Marz, M., Petrov, A. I., Madrigal, P.2026-05-14💻 bioinformatics

PXN Unlocks the Power of Public Gene Expression Data Through Cross-Technology Integration

El artículo presenta PXN, un marco de aprendizaje automático probabilístico que supera la incompatibilidad entre plataformas en los datos públicos de expresión génica al traducir sin fisuras conjuntos de datos diversos (incluyendo la integración de tecnologías de microarrays y RNA-seq) en una representación unificada, mejorando así significativamente la precisión y el poder estadístico de los análisis biológicos integrativos a gran escala.

Sui, Z., Yu, D., Erdengasileng, A., Zhang, J., Qiu, X.2026-05-14💻 bioinformatics

Cataloging cysteines in ECOD domains using a protein language model

Los autores desarrollaron TriCyP, una herramienta basada en modelos de lenguaje de proteínas que predice con precisión los estados funcionales de la cisteína (enlaces disulfuro, coordinación de metales y tioles libres) a partir de estructuras predichas, permitiendo un catálogo a escala de proteoma de 2,7 millones de cisteínas en dominios ECOD que revela patrones biológicos distintos e identifica nuevas familias de unión a metales y potenciales interacciones proteína-proteína.

Yuan, R. D., Durham, J., Cong, Q., Schaeffer, R. D. D.2026-05-14💻 bioinformatics

Protein solubility depends on centrifugation: Aiki-Sol, a per-regime predictor for E. coli

El artículo presenta Aiki-Sol, un predictor de solubilidad de proteínas que supera el estancamiento en el rendimiento de los modelos existentes al considerar explícitamente los regímenes de centrifugación como una característica crítica en lugar de ruido, logrando ganancias significativas en precisión en un nuevo conjunto de datos de E. coli con anotaciones de rigurosidad recién publicado.

Rajagopalan, R., Meda, R. S., Shastry, S., Mysore, V.2026-05-14💻 bioinformatics

A Context-Specific, Literature-Supported Framework for Validating Stress Response Differentially Expressed Gene Sets

Este artículo presenta un marco específico del contexto que valida conjuntos de genes de respuesta al estrés aprovechando redes de interacción proteína-proteína restringidas a genes diferencialmente expresados, demostrando que los genes de "Respuesta Principal" con soporte biológico forman subredes significativamente interconectadas en diversas condiciones de temperatura.

Frishman, B. A., Gonzalez, J. L., Forbes, V. E.2026-05-13💻 bioinformatics