Learning the structural diversity in random protein sequence space

本研究は、高スループット FRET バイオセンサーと機械学習を用いて100 万個の合成ランダムタンパク質をスクリーニングし、生物学的なコンパクトなタンパク質フォールドが、驚くほどランダムな配列空間からアクセス可能で学習可能であることを明らかにし、機能的な構造が稀な特異点であるという考え方に挑戦するものである。

原著者: Buchel, F., Neuwirthova, T., Tureckiova, T., Fuertes, G., Benda, A., Panek, D., Fricek, M., AlQuraishi, M., Hlouchova, K.

公開日 2026-05-05
📖 1 分で読めます☕ さくっと読める

原著者: Buchel, F., Neuwirthova, T., Tureckiova, T., Fuertes, G., Benda, A., Panek, D., Fricek, M., AlQuraishi, M., Hlouchova, K.

原論文は CC BY 4.0 (https://creativecommons.org/licenses/by/4.0/) でライセンスされています。 ⚕️ これは査読を受けていないプレプリントのAI生成解説です。医学的助言ではありません。この内容に基づいて健康上の判断をしないでください。 免責事項の全文を読む

すべての可能なタンパク質の宇宙を、巨大で無限の図書館だと想像してください。現在、地球上の生命はこの図書館にある本のごくわずかな、ごくわずかな断片しか読んでいません。科学者たちは疑問に思ってきました:「良い」本、つまり機能的で安定した形に折りたたまれる本は、棚の奥深くに隠された、めったにない一級品の宝物なのでしょうか?それとも、ページをランダムにめくれば簡単に見つかる、実際には一般的なものでしょうか?

この問いに答えるため、研究者たちは推測を止め、読み始めることにしました。彼らは、自然がこれまで見たことのない、100 万もの新しいランダムな「物語」(タンパク質配列)を作成し、テストしました。生きた細胞の中で、これらのランダムなタンパク質が何をするかを観察するために、彼らは巧妙な高速カメラシステム(FRET バイオセンサー)を使用しました。

これが、ランダムなアイデアの図書館で彼らが見つけたものです:

  • 混沌:多くのランダムなタンパク質は、自分自身で結びつくことができない乱雑な毛糸の山(無秩序な鎖)のようでした。あるいは、細胞をストレスにさらす、粘着性のある有害な塊(凝集体)に固まってしまうものでした。
  • 驚き:しかし、彼らはまた、驚くべき数の「無害な」タンパク質を見つけました。これらは乱雑でも粘着性でもなく、自然界で見られるタンパク質と非常によく似た、コンパクトで球状の形にきれいに折りたたまれていました。決定的なことに、細胞の「警備員」(シャペロン)は、彼らが非常に秩序立っているため、それらに気づいたり、修正を試みたりさえしませんでした。

100 万ものランダムな LEGO の塊を空に投げつけることを想像してください。それらが散らかった塊になって落ちることを期待するかもしれません。しかし、研究者たちは、それらの多くが、熟練した建築家を必要とせず、自分自身で完璧で安定した城の形に落ちたことを発見しました。

最後に、チームはコンピューター(機械学習)に、これらのランダムなタンパク質がきれいに折りたたまれるパターンを認識させるように教えました。コンピューターがこれらのランダムな実験からルールを学習すると、自然界で見られるタンパク質の形も成功裡に予測できるようになりました。

結論
この研究は、「生物学的な」形が、めったにない魔法のような偶然の産物ではないことを示しています。それらは実際には非常に一般的で、ランダムな配列の海の中でもアクセス可能です。これは、進化がすでに成し遂げたことを単に模倣するだけでなく、物理的に可能な広大で未開の領域を探求する、新たなタンパク質を設計するための科学者たちへの新しい地図を提供します。

自分の分野の論文に埋もれていませんか?

研究キーワードに一致する最新の論文のダイジェストを毎日受け取りましょう——技術要約付き、あなたの言語で。

Digest を試す →