Searching the Druggable Genome using Large Language Models
本論文は、自然言語で Drug-Gene Interaction Database (DGIdb) にアクセスし、LLM が構造化された最新生物医学知識を正確に活用できるようにする DGIdb MCP サーバーの開発と、その有効性を示したものである。
1238 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、自然言語で Drug-Gene Interaction Database (DGIdb) にアクセスし、LLM が構造化された最新生物医学知識を正確に活用できるようにする DGIdb MCP サーバーの開発と、その有効性を示したものである。
この論文は、ディリクレ過程事前分布を備えた適応的クラスタ数オートエンコーダが、単細胞トランスクリプトミクスにおけるラベル回復精度の低下を伴う一方で、クラスタの幾何学的構造や可視化忠実度を大幅に向上させ、軌道解析やマンホールド可視化といった特定のタスクにおいて従来の手法を上回ることを示しています。
この論文は、単一細胞遺伝子発現データから解釈可能な遺伝子プログラムを直接読み取れるよう、確率単体制約を課したトピック VAE とフロー場による後部幾何学最適化を組み合わせた「Topic-FM」を提案し、既存手法を上回るクラスタリング性能と生物学的妥当性を 56 のデータセットで実証したものである。
本論文は、高次元・相関・スパース性といった特徴を持つ右打ち切り生存時間データにおいて、バイオマーカー同定および予後モデル構築のための多様な手法を大規模に比較評価し、データ特性に応じた最適な手法(CoxBoost、Adaptive LASSO、LASSO、Elastic Net など)を特定することを目的としている。
本研究は、237 名の長期コホートにおける血清メタボローム解析を通じて、中老年期から高齢期への移行期における認知レジリエンスと、アシルカルニチンや食事由来化合物(ピペリンなど)および薬物代謝物(メトプロロールなど)の代謝プロファイルとの関連性を明らかにし、加齢生物学における分子メカニズムの解明に寄与しました。
本研究は、ミツバチが収集した花粉のメタバーコーディングデータを用いて教師あり機械学習モデルを訓練し、花粉の組成のみでサンプルの採取地を高精度に特定できることを実証しました。
本研究では、アクチグラフィデータの前処理、メトリクス計算、および数学的モデリングを単一のフレームワークで統合し、ウェアラブル機器からの生データから生理学的に解釈可能な概日リズム出力への効率的な移行を可能にする Python パッケージ「circStudio」を紹介しています。
本研究は、機械学習を用いてがんにおけるタンパク質の検出可能性を解析し、mRNA 発現量だけでなく細胞内局在を考慮することで予測精度が向上すること、および多くの遺伝子で転写産物とタンパク質の間に構造的な不一致が存在することを明らかにしました。
本研究は、大腸癌患者の血漿サンプルにおいて、腫瘍由来変異を特定した上で断片長や末端モチーフといった断片化特徴(フラグミクス)を統合解析する手法を開発し、従来の変異読数カウントのみを用いる方法よりも早期再発や微小残存病変の検出精度を向上させることを実証しました。
この論文は、AlphaFold2 を活用して設計した新規ペプチドリガンドを用いることで、ヒト血漿から補体 C1q を高選択的に単離・精製できる画期的なアフィニティ精製法を確立したことを報告しています。