Scalable Construction of Spiking Neural Networks using up to thousands of GPUs

本論文は、マルチGPUクラスターおよびエクサスケールスーパーコンピュータにおける大規模スパイキング神経回路網の構築とシミュレーションのための新規MPIベース手法を提示し、最適化された局所結合およびスパイク交換戦略を通じて複雑な皮質モデルに対する効率的なスケーリングを実証する。

原著者: Bruno Golosio, Gianmarco Tiddia, José Villamar, Luca Pontisso, Luca Sergi, Francesco Simula, Pooja Babu, Elena Pastorelli, Abigail Morrison, Markus Diesmann, Alessandro Lonardo, Pier Stanislao Paolucc
公開日 2026-05-18
📖 1 分で読めます☕ さくっと読める

原著者: Bruno Golosio, Gianmarco Tiddia, José Villamar, Luca Pontisso, Luca Sergi, Francesco Simula, Pooja Babu, Elena Pastorelli, Abigail Morrison, Markus Diesmann, Alessandro Lonardo, Pier Stanislao Paolucci, Johanna Senk

原論文は CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) でライセンスされています。 ⚕️ これは査読を受けていないプレプリントのAI生成解説です。医学的助言ではありません。この内容に基づいて健康上の判断をしないでください。 免責事項の全文を読む

人間の脳をコンピュータ上でシミュレーションすることを想像してみてください。脳は約 860 億個のニューロンからなる巨大な都市であり、各ニューロンは家のようなもので、毎秒何千もの他の家へ微小な電気的な「テキストメッセージ」(スパイクと呼ばれる)を送っています。これをシミュレーションするには、数千枚のグラフィックカード(GPU)が連携して動作するスーパーコンピュータが必要です。

問題は、これらの GPU が島々のような存在だということです。それらは高速ですが、互いに容易に通信できません。ある島から別の島へメッセージを送ろうとすると、「郵便配達員」(通信システム)が行き来しなければならず、それがすべてを遅くしてしまいます。

本論文は、シミュレーション開始前にこれらの接続の「地図」を構築する、はるかに高速な新しい手法を紹介しています。これにより、GPU は交通渋滞に巻き込まれることなくシミュレーションを実行できます。

以下に、彼らがどのように行ったかを簡単に説明します。

1. 旧来の方法:メインランドで地図を構築する

以前、科学者が脳ネットワークをシミュレーションしようとした場合、まず低速な中央コンピュータ(CPU)上で「接続地図」を構築し、その後、この巨大な地図を高速な GPU へコピーする必要がありました。

  • 比喩: 大規模なパーティーを主催すると想像してください。旧来の方法では、キッチン(CPU)で紙にすべてのゲストの名前と知り合いをすべて書き出し、その後、各部屋(GPU)へ走り回ってリストのコピーを手渡していました。準備をするだけで非常に時間がかかりました。

2. 新しい方法:部屋の中で地図を構築する

著者たちは、各 GPU が中央コンピュータを待たずに、自らのメモリ内で直接接続地図の「自分自身の部分」を構築する新しい手法を開発しました。

  • 比喩: 今度は、リストをキッチンで書く代わりに、各部屋に自分専用のメモ帳があります。パーティーが始まると同時に、各部屋のゲストがそこで知り合いを記録します。キッチンへの往復は不要です。
  • 結果: この「オンボード」構築は、旧来の方法よりも10 倍以上高速です。あるテストでは、ネットワークの構築に 12 分近くかかっていたものが、55 秒で完了しました。

3. メッセージを送る 2 つの方法

地図が構築されると、GPU はシミュレーション中に「テキストメッセージ」(スパイク)を交換する必要があります。論文では、ネットワークの構成に応じて、これに対する 2 つの異なる戦略をテストしました。

  • 戦略 A:直接電話(ポイント・ツー・ポイント)

    • 仕組み: GPU #1 内のニューロンが GPU #2 内の特定のニューロンと話したい場合、その特定の GPU に直接電話をかけます。
    • 最適: 接続が不均一または特定のネットワーク(ある領域同士は頻繁に話すが、全員とは話さない実際の脳など)に適しています。
    • 論文の主張: 彼らはマウスの視覚皮質(32 の異なる領域)のモデルにこれを使用しました。完全に機能し、新しい地図構築手法が複雑な現実世界の脳構造と互換性があることを証明しました。
  • 戦略 B:グループチャット(集合通信)

    • 仕組み: 個人に電話する代わりに、GPU はメッセージを GPU のグループ全体に一度に叫びます。グループ内の全員がその叫びを聞き、メッセージが自分宛かどうかを確認します。
    • 最適: 全員が全員と話をするような、巨大でランダムなネットワーク(バランスの取れた群衆など)に適しています。
    • 論文の主張: 彼らは最大1,024 枚の GPUにスケールアップする巨大な「バランス型ネットワーク」でこれをテストしました。これは多数のグラフィックカードが連携して動作する非常に大きな数です。彼らは、これだけの数のカードがあっても、システムがクラッシュすることなくスムーズにスケールアップすることを示しました。

4. 「メモリレベル」のトリック

GPU には多くのメモリがありますが、無限ではありません。数十億のニューロンに対する接続地図を保存するには、非常に多くのスペースが必要です。

  • 比喩: 小さな机(GPU メモリ)と巨大な倉庫(CPU メモリ)を持っていると想像してください。
  • 解決策: 著者たちは、4 つの「レベル」の組織化を作成しました。
    • レベル 0: 地図を倉庫(CPU)に置き、必要なものだけを机へ持ち込みます。これは机のスペースを節約しますが、取得に時間がかかります。
    • レベル 3: 机にすべてを詰め込みます。これは最速ですが、より大きな机が必要です。
  • 論文の主張: 適切なレベルを選択することで、Leonardo Boosterスーパーコンピュータ(4,096 枚の GPU を搭載)上でシミュレーションを実行でき、さらに今後のJUPITERスーパーコンピュータが2 億 3,000 万ニューロンと 2.5 兆シナプスを持つネットワークをシミュレーションできると予測できることを示しました。これはほぼ人間の皮質のサイズに相当します!

彼らが達成したことのまとめ

  • 速度: ネットワーク地図をグラフィックカード上で直接構築することで、脳シミュレーションの「セットアップ」フェーズを 10 倍高速化しました。
  • スケーラビリティ: 最大 1,024 枚の GPU を同時に使用しても機能することを証明しました。
  • 柔軟性: 通信を処理する 2 つの異なる方法(直接電話対グループチャット)を示し、科学者が特定の脳モデルに最適な方法を選択できるようにしました。
  • 将来性: 彼らの手法は、個々のシナプス詳細を備えた完全な人間の脳をシミュレーションできるほど強力になる次世代の「エクサスケール」スーパーコンピュータで動作するように設計されています。

要約すれば、彼らは単にシミュレーションを高速化しただけでなく、レースが始まる前にスーパーコンピュータが交通渋滞に巻き込まれないよう、データのためのより良い「道路システム」を構築したのです。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →