Statistical detection of protein sites associated with continuous traits
連続形質と関連するタンパク質部位を検出するための新しい統計的検出法を提案し、シミュレーションによる性能評価と哺乳類の寿命に関する実データへの適用を通じて、従来の手法よりも高い検出力を持つ一方で計算コストが高いため候補部位のフィルタリングを推奨し、その手法を Pelican ソフトウェアに実装したことを報告しています。
1243 件の論文
バイオインフォマティクスは、膨大な生物学的データをコンピュータの力で解析し、生命の謎を解き明かす分野です。ゲノム情報やタンパク質の構造といった複雑なデータから、新たな発見を引き出すための重要な橋渡し役となっています。
Gist.Science では、bioRxiv から公開される最新のプレプリントをすべて対象に、この分野の論文を網羅的に扱っています。専門的な詳細な要約に加え、難しい専門用語を避け、誰でも理解できる平易な日本語での解説も併せて提供しています。
以下に、bioRxiv から更新されたばかりのバイオインフォマティクスに関する最新論文の一覧を掲載します。
連続形質と関連するタンパク質部位を検出するための新しい統計的検出法を提案し、シミュレーションによる性能評価と哺乳類の寿命に関する実データへの適用を通じて、従来の手法よりも高い検出力を持つ一方で計算コストが高いため候補部位のフィルタリングを推奨し、その手法を Pelican ソフトウェアに実装したことを報告しています。
この論文は、機械学習と SHAP による解釈性を活用して大豆の多オミクスデータを統合解析し、干ばつストレス下でイソフラボン誘導体(ダイジン)や特定微生物が植物の表現型に与える影響を明らかにした研究です。
Cenote-Taker 3 は、既知の配列と高い分岐を示すウイルスゲノムを含むシーケンスデータからウイルスを発見し、遺伝子を正確かつ高速に注釈するための、高性能で拡張可能なコマンドラインツールとして開発されました。
本研究では、CUT&Tag 法における Tn5 転移酵素に起因するオープンクロマチンバイアスを ATAC-seq データと機械学習を用いて補正する手法「PATTY」を開発し、これによりヒストン修飾の正確な検出や単一細胞レベルの細胞クラスタリングの精度向上を実現したことを報告しています。
この論文では、合成ヒトゲノムデータのプライバシーリスクを、遺伝的座標空間での近接性、血縁・集団構造のパターン、および稀な変異やメンバーシップ推論の露出という 3 つの視点から評価し、0〜100 のスコアで可視化する解釈可能なプライバシー評価手法「PRISM-G」を提案し、異なる生成モデルにおける脆弱性の多様性を明らかにしました。
本論文は、分子動力学シミュレーションを用いて CFTR の電荷相互作用ネットワーク、イオンおよび脂質との相互作用、および VX-770 結合の影響を包括的に解析し、CFTR の構造安定性、イオン透過、およびアロステリック調節の分子機構を解明した。
本論文は、組織学的形態特徴とスポットレベルの細胞構成比を統合する弱教師ありフレームワーク「HEDeST」を提案し、既存の手法を上回る単一細胞解像度の空間トランスクリプトミクス解析を実現するものである。
本論文は、Nucleotide Transformer と確率回路を組み合わせることで、がん細胞と正常細胞の識別において遺伝子の重要性を解釈可能に定量化する新しい XAI ベースの遺伝子プロファイリングフレームワーク「DVPNet」を提案し、従来の統計的手法を超えた生物学的洞察を提供するものです。
本論文は、大規模バイオバンクデータにおける遺伝的クラスタリングの推定を、ヘッセ行列近似を回避しつつアダマ(Adam)最適化を統合した「ADAMIXTURE」という新しい最適化フレームワークにより、従来法に比べて計算コストを大幅に削減し、精度を維持または向上させることを提案しています。
FOODIE フットプリンティングと AlphaGenome を統合した varTFBridge という手法を開発し、赤血球形質に関連する多数の非コード領域変異が転写因子結合を介して遺伝子制御ネットワークを再配線するメカニズムを解明しました。