SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion
本論文は、GWAS に基づく変異選択と条件付き潜在拡散モデルを組み合わせ、表現型情報を反映した合成遺伝子型データを生成し、プライバシーを保護しつつ下流の予測タスクで実データに匹敵する性能を発揮する「SNPgen」と呼ばれるフレームワークを提案するものである。
2316 件の論文
本論文は、GWAS に基づく変異選択と条件付き潜在拡散モデルを組み合わせ、表現型情報を反映した合成遺伝子型データを生成し、プライバシーを保護しつつ下流の予測タスクで実データに匹敵する性能を発揮する「SNPgen」と呼ばれるフレームワークを提案するものである。
この論文は、低 SNR や被験者間のばらつきといった課題に対処するため、InceptionTime エンコーダにローレンツ注意モジュールを統合し、全被験者に共通する基底信号の学習と被験者固有の埋め込みの獲得を通じて、クロス被験者 EEG 分類の性能を飛躍的に向上させる新たなフレームワーク「LAtte」を提案するものです。
この論文は、U-Net 基盤をトランスフォーマーと 2D CNN エンコーダーに置き換えたパラメータ効率の高い拡散トランスフォーマー(DiT)を提案し、細胞特異的な調節 DNA 配列の生成において、従来モデルよりもはるかに少ないエポック数で収束し、過学習を抑制するとともに、Enformer を報酬モデルとした DDPO 微調整により予測される調節活性を劇的に向上させたことを示しています。
この論文は、従来の適合度検定の限界を克服し、分布間の統計的に意味のある差異の不在を評価するための、カーネル・スタイン不一致と最大平均不一致を用いた新しい等価性検定手法を提案し、その漸近正規性近似およびブートストラップ法に基づく臨界値の計算方法を提示しています。
この論文は、大規模推論モデルの強化学習ファインチューニングにおいて、コストのかかるロールアウトを伴う従来のオンラインプロンプト選択手法の問題を解決するため、学習ダイナミクスを隠れマルコフモデルでモデル化しベイズ推論を用いて事前予測を行う「Dynamics-Predictive Sampling (DPS)」を提案し、不要な計算コストを削減しながら推論性能を向上させることを示しています。
この論文は、強化学習において非エルゴード的な報酬過程が存在する場合、個々のエージェントの長期パフォーマンスを最適化するために期待値ではなく単一軌道の平均を重視する必要性と、その解決策について論じています。
本論文は、ドラフト生成を不要としながら将来の情報を活用して KV キャッシュの重要度を高精度に予測する軽量フレームワーク「LookaheadKV」を提案し、既存の手法よりもはるかに低いコストで長文脈タスクにおけるエビクション精度と推論速度を大幅に向上させることを示しています。
この論文は、ランク・スコア特性関数と認知的多様性を用いた組み合わせ融合分析(CFA)を適用して 2024 年の NCAA 大会データを分析し、既存の 10 大公的ランキングシステムを上回る 74.60% の予測精度を達成したことを報告しています。
本論文は、自動車内での時間系列異常検出において、精度だけでなく制約のある計算リソース下での実用性を評価する新しいプロトコル「ECoLAD」を提案し、軽量な古典的検出器が深層学習手法よりも厳しいスループット制約下でも安定した検出性能を維持できることを実証しています。
本論文は、複数のガウス混合モデルクラスタリングの制約を反復的に選択・最適化する「Historical Consensus Training」を導入することで、アーキテクチャの制約やハイパーパラメータの調整なしに、変分オートエンコーダにおける後方崩壊を根本的に防止し、安定した潜在表現を学習可能にする手法を提案しています。
この論文は、合成データが訓練データに含まれる個人を特定する「メンバーシップ推論攻撃」にどの程度脆弱かを評価するため、カーネル密度推定を用いた実用的なリスク定量化手法を提案し、既存の手法よりも高い精度でリスクを評価できることを示しています。
本論文は、従来の期待値ベースの制約では捉えきれない分布の尾部リスクや分布外故障に対処するため、最適輸送枠組みを用いた第一階確率支配制約を導入し、スペクトルリスク測度を普遍的に制御する新しい安全 RLHF 手法「RAD」を提案し、有害性の向上と分布外評価における堅牢性の両立を実証したものである。
本論文は、高リスクな応用において質量スペクトルからの分子構造推定の信頼性を確保するため、不確実性が高い場合に予測を保留する選択的予測フレームワークを提案し、MassSpecGym ベンチマークを用いた評価により、計算コストの低い信頼度指標や検索レベルの偶然的不確実性がリスク・カバレッジのトレードオフにおいて優れていることを示しています。
本論文では、テスト時スケーリング下での推論 LLM のランキング手法を体系化し、統計的ランキング法を実装したオープンソースライブラリ「Scorio」を提案するとともに、複数のベンチマークにおけるその有効性を検証しました。
この論文は、人間の運動の生物学的構造(サブムーブメント理論)に基づいて腕時計型 IMU 信号を「運動セグメント」というトークンに変換し、マスクされたセグメント再構成による自己教師あり学習を行うことで、ラベル付きデータの不足を克服し、既存手法を上回る人間活動認識の性能とデータ効率を実現する新たな手法を提案しています。
本論文は、大規模なマルチモーダルデータや膨大なデータセットに依存せず、3 万 9 千点の点雲のみで学習された軽量トランスフォーマー「Pointy」を提案し、その設計と統一的な評価枠組みを通じて、より大規模なモデルに匹敵する性能を達成することを示しています。
この論文は、CVE データベースに基づき大規模言語モデル(LLM)が安全なコードと脆弱なコードを区別する能力を測定する新しいベンチマーク「TOSSS」を提案し、14 種類のモデルを C/C++ および Java で評価した結果、セキュリティスコアが 0.48 から 0.89 の範囲に分布することを示しています。
本論文は、B5G 向けセルフリー mmWave ネットワークにおける物理層の盗聴検知と多 RIS 構成の最適化を、プライバシーを保護しつつ計算効率を向上させたフェデレーテッドラーニングと早期退出機構を備えた深層畳み込みニューラルネットワークを用いて実現する新たなフレームワークを提案し、非 RIS 支援方式と比較して秘匿性を約 30% 向上させることを示しています。
この論文は、LEO 衛星コンステレーションにおける動的な伝搬条件下でのビーム管理を目的として、高高度プラットフォームステーションを活用した分散学習(連合学習)を提案し、低仰角を含む実データを用いた評価により、多層パーセプトロン(MLP)よりもグラフニューラルネットワーク(GNN)がビーム予測の精度と安定性において優れていることを実証しています。
この論文は、トランスフォーマーの MLP 層が連続信号を処理する際、特定のニューロン群が「デフォルト ON」と「例外処理」の二値ルーティングを行うことで、トークンに非線形処理が必要かどうかを決定していることを示し、この二値的な構造が平滑な多項式近似の失敗や、連続値活性化の追加的な情報量と整合することを明らかにしています。