A Resolution-Agnostic Geometric Transformer for Chromosome Modeling Using Inertial Frame
本論文は、慣性座標系と幾何学的な位置エンコーディングを備えたトランスフォーマーモデル「InertialGenome」を提案し、解像度に依存せず高精度かつ頑健に染色体の 3 次元構造を再構築し、実験結果との整合性や解像度間転移学習においても優れた性能を示すことを実証したものである。
1248 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
本論文は、慣性座標系と幾何学的な位置エンコーディングを備えたトランスフォーマーモデル「InertialGenome」を提案し、解像度に依存せず高精度かつ頑健に染色体の 3 次元構造を再構築し、実験結果との整合性や解像度間転移学習においても優れた性能を示すことを実証したものである。
本論文は、Nanopore や PacBio などの長リード単細胞 RNA シーケンシングデータから、サブエクソン結合モデルや動的閾値法を用いて既存の手法よりも高精度に既知および新規アイソフォームを同定・定量化するエンドツーエンドのパイプライン「SCOTCH」を提案し、その有効性をシミュレーションおよび実データ解析で実証したものである。
この論文は、生体医学データセットの AI 適用準備性を評価・向上させるために、メタデータと深層プロベナンスグラフを活用したデジタル共通環境「FAIRSCAPE」フレームワークを開発し、大規模な NIH データ生成プログラムにおいてその有効性を実証したことを報告しています。
この論文は、生存分析における高次元媒介分析の課題を解決し、潜在的な交絡因子を調整する新しいフレームワーク「HDMAX2-surv」を提案し、膵臓がんのデータを用いてタバコ曝露が生存率に与える影響を媒介するメチル化領域や免疫経路を同定したことを報告しています。
本研究は、長鎖 RNA シーケンシングとマススペクトロメトリーデータを統合したワークフローを開発し、ハプロタイプ分解されたサンプル固有のタンパク質アイソフォームを特定することで、従来の参照データベースでは検出が困難な変異やスプライス関連ペプチドの検出を可能にする実用的な枠組みを提示した。
この論文は、セット数ではなく非空領域の数に依存して計算時間が決定される新しいアプローチを採用し、多数のセットを含む可読性の高い準比例ベン図を生成する「nVenn2」アルゴリズムとその多様な実装を提案しています。
本論文では、複雑なアライメントパターンを持つ構造変異の検出を目的として、アライメントとアセンブリの証拠を統合し事前モデルに依存しない汎用検出器「gSV」を提案し、シミュレーションおよび実データによるベンチマーク、ならびに乳がん細胞株や集団コホートへの適用を通じて、その優れた感度と臨床・研究における有用性を示しました。
本研究は、AlphaFold 由来の 3D 構造と進化制約を CLIP 方式で統合したマルチモーダル埋め込みモデル「EvoStructCLIP」を提案し、CAGI7 などの盲検評価において、特定の遺伝子に特化せず多様な生物学的タスクに汎用的に適用可能な変異影響予測能力を実証したものである。
CAMDA 2025 健康プライバシーチャレンジの成果として、11 の生成モデルをベンチマークした本論文は、トランスクリプトミクスデータ合成において、予測有用性や生物学的妥当性とプライバシーリスクの間に明確なトレードオフが存在し、モデル選択はデータ特性や利用目的に応じて最適化すべきであることを示しています。
FORVM に基づく計算フレームワーク「Kg4j」を用いて、子宮内膜症と残留性有機汚染物質(POPs)の関連を解明する小規模な知識グラフを構築し、実験データとの統合や重複除去による精度向上を通じて、疾患のメカニズム解明や仮説生成を支援する手法を提案した。