Multi-view biomedical foundation models for molecule-target and property prediction

Os autores desenvolveram o MMELON, um modelo fundamental multimodal que integra representações de grafos, imagens e texto de até 200 milhões de moléculas para prever propriedades e interações moleculares com desempenho robusto, validando sua eficácia na identificação de ligantes para receptores GPCRs associados à doença de Alzheimer.

Parthasarathy Suryanarayanan, Yunguang Qiu, Shreyans Sethi, Diwakar Mahajan, Hongyang Li, Yuxin Yang, Elif Eyigoz, Aldo Guzman Saenz, Daniel E. Platt, Timothy H. Rumbell, Kenney Ng, Sanjoy Dey, Myson Burch, Bum Chul Kwon, Pablo Meyer, Feixiong Cheng, Jianying Hu, Joseph A. Morrone

Publicado 2026-02-27
📖 4 min de leitura☕ Leitura rápida
⚕️

Esta é uma explicação gerada por IA de um preprint que não foi revisado por pares. Não é aconselhamento médico. Não tome decisões de saúde com base neste conteúdo. Ler aviso legal completo

Each language version is independently generated for its own context, not a direct translation.

Imagine que você está tentando descrever um objeto complexo, como uma torre de Lego, para um amigo que nunca a viu.

Se você apenas escrever uma lista de peças (como "peça vermelha, peça azul, peça amarela"), seu amigo terá uma ideia, mas pode não entender a forma.
Se você apenas desenhar a torre, ele verá a forma, mas não saberá de quais peças específicas ela é feita.
Se você apenas mostrar o diagrama de montagem (o gráfico de conexões), ele saberá como as peças se encaixam, mas talvez não visualize a cor ou o estilo final.

Cada uma dessas descrições é uma "visão" diferente da mesma coisa. O problema é que, na ciência de descoberta de remédios, os cientistas muitas vezes escolhiam apenas uma dessas visões para treinar seus computadores, o que limitava o que a máquina podia aprender.

Este artigo apresenta uma nova solução chamada MMELON. Pense no MMELON como um super-intérprete ou um chef de cozinha que não confia em apenas uma receita. Ele reúne três especialistas diferentes para criar a melhor descrição possível de uma molécula:

  1. O Especialista em Texto: Ele lê a "receita" da molécula (uma sequência de letras chamada SMILES, como um código de barras químico).
  2. O Especialista em Imagem: Ele olha para o "desenho" 2D da molécula, vendo a forma e a simetria.
  3. O Especialista em Gráfico: Ele analisa o "diagrama de conexões", entendendo como cada átomo está ligado ao outro, como um mapa de estradas.

Como funciona a "Fusão Tardia"?

A grande inovação deste trabalho é como eles juntam essas três opiniões. Eles não misturam tudo de uma vez bagunçado. Eles deixam cada especialista estudar milhões de moléculas sozinho primeiro (isso é o "pré-treinamento").

Depois, quando chega a hora de resolver um problema real (como prever se um remédio vai funcionar), eles trazem os três especialistas para uma sala de reuniões. O MMELON usa um mecanismo inteligente (chamado de "atenção") para decidir quem fala mais alto naquela situação específica.

  • Às vezes, a imagem é a mais importante para entender a forma do remédio.
  • Às vezes, o gráfico é crucial para entender a química.
  • Às vezes, o texto ajuda a lembrar de propriedades conhecidas.

O sistema aprende a dar um "peso" diferente para cada especialista dependendo da tarefa. É como se, para um problema de solubilidade, o sistema dissesse: "Hoje, vamos ouvir mais o Especialista em Imagem", e para outro problema, "Hoje, o Especialista em Gráfico tem a palavra final".

O Grande Teste: A Doença de Alzheimer

Para provar que seu "super-intérprete" funciona, os cientistas o usaram em um desafio real: encontrar novos tratamentos para a Doença de Alzheimer.

Eles sabiam que certos receptores no cérebro (chamados GPCRs) estavam ligados à doença, mas não sabiam quais remédios ou substâncias naturais poderiam "travar" nesses receptores para curar o problema.

O MMELON vasculhou uma biblioteca gigante de:

  • Remédios já aprovados (que sabemos que são seguros).
  • Metabólitos do intestino (substâncias que nosso corpo produz a partir do que comemos).

O modelo identificou candidatos promissores. Por exemplo, ele sugeriu que uma substância chamada glutationa (um antioxidante que já usamos como suplemento) poderia se ligar a um receptor específico ligado ao Alzheimer.

Para confirmar, eles usaram simulações de computador (como se estivessem montando as peças de Lego virtualmente) e viram que a forma da molécula se encaixava perfeitamente no receptor, como uma chave na fechadura.

Por que isso é importante?

Antes, os cientistas tinham que escolher entre usar apenas texto, apenas imagem ou apenas gráficos. Era como tentar montar um quebra-cabeça olhando apenas para as bordas.

Com o MMELON, eles têm uma visão completa. O modelo é tão bom que, na maioria dos testes, ele bateu o recorde dos melhores modelos que usavam apenas uma visão. E o melhor: ele é flexível. Se no futuro quisermos adicionar uma visão 3D (como um holograma da molécula), o sistema pode simplesmente "convidar" esse novo especialista para a reunião.

Em resumo: Os pesquisadores criaram um time de especialistas que, juntos, entendem as moléculas muito melhor do que qualquer um deles sozinho, acelerando a descoberta de novos remédios para doenças difíceis como o Alzheimer.

Receba artigos como este na sua caixa de entrada

Digests diários ou semanais personalizados de acordo com seus interesses. Gists ou resumos técnicos, no seu idioma.

Experimentar Digest →