Huntington Disease Automatic Speech Recognition with Biomarker Supervision
ハンチントン病の音声認識(ASR)において、高品質な臨床コーパスを用いた体系的な研究により、Parakeet-TDT アーキテクチャの優位性を示し、生体マーカーに基づく補助教師信号を用いることで誤り率を 6.99% から 4.95% まで改善する手法を提案し、コードとモデルをオープンソース化しました。
3587 件の論文
ハンチントン病の音声認識(ASR)において、高品質な臨床コーパスを用いた体系的な研究により、Parakeet-TDT アーキテクチャの優位性を示し、生体マーカーに基づく補助教師信号を用いることで誤り率を 6.99% から 4.95% まで改善する手法を提案し、コードとモデルをオープンソース化しました。
この論文は、学生モデルの習熟度(正解率)が極端な問題に対する学習効率の低下という構造的な課題を理論的に解明し、その中間領域に学習を集中させる重み付け関数を用いた「PACED」という蒸留フレームワークを提案し、標準的なベンチマークで顕著な性能向上と忘却の抑制を実現したことを示しています。
この論文は、既知の物理モデルとガウス過程を組み合わせたハイブリッドモデルを用いたベイズ最適化手法を提案し、部分既知システムの最適化において、標準的なベイズ最適化よりもはるかに少ない試行回数で高品質な解を導出できることを示しています。
本論文は、DNS クエリのシーケンスからドメイン名の埋め込みを学習する自己教師あり型トランスフォーマーモデル「DNS-GT」を提案し、ドメイン分類やボットネット検出などのタスクにおいて既存手法を上回る性能を実証したものである。
この論文は、パラメータ効率性と安定性を両立させるため、従来の重み空間ではなく表現空間での低ランク部分空間への介入を通じて継続学習を行う新たなフレームワーク「CoRe」を提案し、既存の手法を上回る性能を実証したものである。
本論文は、既存の近似学習忘却手法が抱える最適化の不安定さや汎化性能の低下という課題を解決するため、忘却データと真の未見データの分布を一致させることを目指し、保持された独立データセットを参照して蒸馏を行う「ReGUn」という新しい学習忘却フレームワークを提案し、その有効性を示しています。
この論文は、コード生成用大規模言語モデル(LLM)が脆弱性を生成する際にも内部でセキュリティ概念を認識していることを発見し、その内部表現を操作して安全かつ機能的なコード生成を誘導する軽量かつモジュール型の手法「SCS-Code」を提案し、既存の最先端手法を上回る性能を実証したものである。
この論文は、2024 年 8 月から 2026 年 2 月にかけてリリースされた 7 種類の最先端 AI モデルが、企業ネットワークや産業制御システムを対象とした多段階サイバー攻撃シナリオにおいて、推論時の計算リソースの増加とモデル世代の進化に伴い、人間専門家の約 6 時間に相当する 32 段階中の 22 段階を達成するなど、顕著な能力向上を示したことを報告しています。
本論文は、大規模言語モデルによる反復推論をマルコフ連鎖として定義し、温度パラメータや初期入力などの要因に応じて文の多様性が増加または減少する動的な収束挙動を明らかにしたものである。
この論文は、稀な事象を含む高次元データに対する予測分布の信頼性を向上させるため、ベースモデルの誤りを特定・修正する「診断輸送マップ」を提案し、ハリケーン強度の短期予測において実用的な改善効果を実証したものである。
この論文は、スマートバンドによる生体信号とモバイルアプリによる生態的瞬間評価(EMA)を組み合わせ、機械学習を用いて高齢者の日常活動中の気分状態を自動的に監視・予測するウェアラブルシステムを提案し、特に「幸福感」と「活動性」の検出において最先端の精度を達成したことを報告しています。
南アフリカとウガンダのコミュニティ医療センターで収集された結核患者の咳音データを用いた研究において、XLS-R の最初の 3 層のみを活用した事前学習済みトランスフォーマーモデルが、咳の開始・終了点の自動検出およびその後の結核分類タスクにおいて、既存のモデルやベースラインを凌駕する高い精度と計算効率を実現し、スマートフォンを用いた大規模なスクリーニングツールの実用化可能性を示しました。
この論文は、単一細胞遺伝子発現データに対する生成モデルの評価における標準化の欠如と再現性の課題を解決するため、生物学的根拠に基づいた包括的な評価指標とオープンソースフレームワーク「GGE」を提案し、公平な比較と研究の加速を可能にすることを目的としています。
本研究は、統計熱力学に基づく離散列挙とマスク付きソフトマックス集約、およびストレートスルー勾配推定器を組み合わせた「DISCOMAX」という可微分アルゴリズムを提案し、熱力学的整合性を保証しつつ液体 - 液体平衡データからニューラルネットワークによる過剰ギブズエネルギーモデルを学習可能にする新たな枠組みを示しています。
この論文は、Klinkenberg 効果を含む非線形ガス流を Hopf-Cole 変換と混合定式化、共有トランク型ニューラルネットワーク、および DeepLS ソルバーを統合した機械学習フレームワークにより線形化し、圧力・速度場の高精度予測と圧力依存性透過率などの逆問題の効率的な推定を実現する手法を提案しています。
この論文は、単一ドメインデータで訓練されたモデルが直面する「ドメイン感度の崩壊」という幾何学的な欠陥を理論的に解明し、教師モデルからクラスに抑制された残差構造を蒸留する「教師誘導型学習(TGT)」を提案することで、推論時のオーバーヘッドを増やすことなく分布外検出性能を大幅に向上させる手法を提示しています。
この論文は、音声認識(ASR)の処理時間が音声の長さで正確に推定できるという知見に基づき、vLLM に最短処理時間優先(SJF)や最高応答率優先(HRRN)といったスケジューリングアルゴリズムを導入することで、負荷変動下でも尾部レイテンシの悪化を抑制しつつ最大 73% の中央値レイテンシ改善を実現する手法を提案しています。
本論文は、モデル学習過程における交差検証に基づく正則化の確率的性質が、ブラックボックス推定器を用いた文脈付きバンドット問題において、トンプソンサンプリングと理論的に同等の探索を自然に誘発することを示し、大規模実環境において従来の手法を上回る性能を達成する「RIE-Greedy」という新たな手法を提案している。
本論文は、状態空間モデルが生物学的な画像データにおける疎で不規則な時間プロセスを扱う際に直面する根本的な課題を明らかにするため、単一分子局在顕微鏡シミュレーションに基づく新たなベンチマーク「SMLM-C」を提案し、その評価結果を報告したものです。
この論文は、異なるドメイン間での分布のシフトに起因する PCA の不安定性に対処するため、複数のドメインにおける最悪ケース性能を最適化する「wcPCA」という統一的な枠組みを提案し、その理論的保証と実データへの適用による性能向上を実証しています。