Scalable Construction of Spiking Neural Networks using up to thousands of GPUs

Este artigo apresenta um método inovador baseado em MPI para construir e simular redes neurais de spiking em grande escala em clusters multi-GPU e supercomputadores exascale, demonstrando escalabilidade eficiente para modelos corticais complexos por meio de estratégias otimizadas de conectividade local e troca de spikes.

Autores originais: Bruno Golosio, Gianmarco Tiddia, José Villamar, Luca Pontisso, Luca Sergi, Francesco Simula, Pooja Babu, Elena Pastorelli, Abigail Morrison, Markus Diesmann, Alessandro Lonardo, Pier Stanislao Paolucc
Publicado 2026-05-18
📖 5 min de leitura🧠 Leitura aprofundada

Autores originais: Bruno Golosio, Gianmarco Tiddia, José Villamar, Luca Pontisso, Luca Sergi, Francesco Simula, Pooja Babu, Elena Pastorelli, Abigail Morrison, Markus Diesmann, Alessandro Lonardo, Pier Stanislao Paolucci, Johanna Senk

Artigo original sob licença CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). ⚕️ Esta é uma explicação gerada por IA de um preprint que não foi revisado por pares. Não é aconselhamento médico. Não tome decisões de saúde com base neste conteúdo. Ler aviso legal completo

Imagine tentar simular o cérebro humano em um computador. O cérebro é uma cidade massiva de cerca de 86 bilhões de neurônios, onde cada neurônio é uma casa enviando pequenas "mensagens de texto" elétricas (chamadas de picos) para milhares de outras casas a cada segundo. Para simular isso, você precisa de um supercomputador com milhares de placas gráficas (GPUs) trabalhando juntas.

O problema é que essas GPUs são como ilhas. Elas são rápidas, mas não conversam entre si facilmente. Se uma ilha quiser enviar uma mensagem para outra, o "carteiro" (o sistema de comunicação) tem que correr de um lado para o outro, o que deixa tudo mais lento.

Este artigo apresenta uma nova maneira, muito mais rápida, de construir o mapa dessas conexões antes da simulação começar, para que as GPUs possam executar a simulação sem ficar presas no trânsito.

Veja como eles fizeram isso, explicado de forma simples:

1. A Maneira Antiga: Construindo o Mapa no Continente

Anteriormente, quando cientistas queriam simular uma rede cerebral, eles construíam o "mapa de conexões" no computador lento e central (a CPU) primeiro. Depois, tinham que copiar esse mapa massivo para as GPUs rápidas.

  • A Analogia: Imagine que você está organizando uma festa massiva. No método antigo, você escrevia o nome de cada convidado e quem eles conheciam em um pedaço de papel na cozinha (CPU), depois corria para cada sala (GPU) para entregar uma cópia da lista. Isso levava muito tempo apenas para se preparar.

2. A Maneira Nova: Construindo o Mapa Dentro das Salas

Os autores desenvolveram um novo método onde cada GPU constrói sua própria parte do mapa de conexões diretamente em sua própria memória, sem esperar pelo computador central.

  • A Analogia: Agora, em vez de escrever a lista na cozinha, cada sala tem seu próprio bloco de notas. Assim que a festa começa, os convidados em cada sala escrevem quem eles conhecem ali mesmo. Não é necessário correr de um lado para o outro até a cozinha.
  • O Resultado: Essa construção "a bordo" é mais de 10 vezes mais rápida do que a maneira antiga. Em um teste, levou 55 segundos para construir a rede em vez de quase 12 minutos.

3. Duas Maneiras de Enviar Mensagens

Uma vez que o mapa é construído, as GPUs precisam trocar as "mensagens de texto" (picos) durante a simulação. O artigo testou duas estratégias diferentes para isso, dependendo de como a rede é organizada:

  • Estratégia A: A Ligação Telefônica Direta (Ponto a Ponto)

    • Como funciona: Se um neurônio na GPU #1 precisa falar com um neurônio específico na GPU #2, ele liga diretamente para aquela GPU específica.
    • Melhor para: Redes onde as conexões são desiguais ou específicas (como um cérebro real onde algumas áreas conversam muito entre si, mas não com todos).
    • A Alegação do Artigo: Eles usaram isso para um modelo do córtex visual de macaco (32 áreas diferentes). Funcionou perfeitamente, provando que o novo método de construção de mapas é compatível com estruturas cerebrais complexas e do mundo real.
  • Estratégia B: O Chat em Grupo (Comunicação Coletiva)

    • Como funciona: Em vez de ligar para indivíduos, uma GPU grita suas mensagens para um grupo inteiro de GPUs de uma vez. Todos no grupo ouvem o grito e verificam se a mensagem é para eles.
    • Melhor para: Redes enormes e aleatórias onde todos conversam com todos (como uma multidão equilibrada).
    • A Alegação do Artigo: Eles testaram isso em uma enorme "rede balanceada" escalando até 1.024 GPUs. Este é um número enorme de placas gráficas trabalhando juntas. Eles mostraram que, mesmo com tantas placas, o sistema escala suavemente sem travar.

4. O Truque dos "Níveis de Memória"

As GPUs têm muita memória, mas não infinita. Armazenar os mapas de conexão para bilhões de neurônios ocupa muito espaço.

  • A Analogia: Imagine que você tem uma pequena mesa (memória da GPU) e um enorme armazém (memória da CPU).
  • A Solução: Os autores criaram quatro "níveis" de organização.
    • Nível 0: Mantenha os mapas no armazém (CPU) e traga apenas o que você precisa para a mesa. Isso economiza espaço na mesa, mas é mais lento para buscar.
    • Nível 3: Encha a mesa com tudo. Isso é o mais rápido, mas requer uma mesa maior.
  • A Alegação do Artigo: Eles mostraram que, escolhendo o nível certo, podiam executar simulações no supercomputador Leonardo Booster (que possui 4.096 GPUs) e até prever que o próximo supercomputador JUPITER poderia simular uma rede com 230 milhões de neurônios e 2,5 trilhões de sinapses. Isso é aproximadamente o tamanho do córtex humano!

Resumo do Que Eles Conquistaram

  • Velocidade: Eles tornaram a fase de "configuração" das simulações cerebrais 10 vezes mais rápida construindo o mapa da rede diretamente nas placas gráficas.
  • Escala: Eles provaram que isso funciona em até 1.024 GPUs simultaneamente.
  • Flexibilidade: Eles mostraram duas maneiras diferentes de lidar com a comunicação (ligações diretas vs. chats em grupo) para que os cientistas possam escolher o melhor método para seu modelo cerebral específico.
  • Preparado para o Futuro: Seus métodos são projetados para funcionar na próxima geração de supercomputadores "Exaescala", que serão poderosos o suficiente para simular um cérebro humano completo com detalhes de sinapses individuais.

Em resumo, eles não apenas fizeram a simulação rodar mais rápido; eles construíram um melhor "sistema de estradas" para os dados, para que o supercomputador não fique preso no trânsito antes mesmo da corrida começar.

Afogado em artigos na sua área?

Receba digests diários dos artigos mais recentes que correspondam às suas palavras-chave de pesquisa — com resumos técnicos, no seu idioma.

Experimentar Digest →