Markovian Generation Chains in Large Language Models
本論文は、大規模言語モデルによる反復推論をマルコフ連鎖として定義し、温度パラメータや初期入力などの要因に応じて文の多様性が増加または減少する動的な収束挙動を明らかにしたものである。
3797 件の論文
本論文は、大規模言語モデルによる反復推論をマルコフ連鎖として定義し、温度パラメータや初期入力などの要因に応じて文の多様性が増加または減少する動的な収束挙動を明らかにしたものである。
この論文は、稀な事象を含む高次元データに対する予測分布の信頼性を向上させるため、ベースモデルの誤りを特定・修正する「診断輸送マップ」を提案し、ハリケーン強度の短期予測において実用的な改善効果を実証したものである。
この論文は、スマートバンドによる生体信号とモバイルアプリによる生態的瞬間評価(EMA)を組み合わせ、機械学習を用いて高齢者の日常活動中の気分状態を自動的に監視・予測するウェアラブルシステムを提案し、特に「幸福感」と「活動性」の検出において最先端の精度を達成したことを報告しています。
南アフリカとウガンダのコミュニティ医療センターで収集された結核患者の咳音データを用いた研究において、XLS-R の最初の 3 層のみを活用した事前学習済みトランスフォーマーモデルが、咳の開始・終了点の自動検出およびその後の結核分類タスクにおいて、既存のモデルやベースラインを凌駕する高い精度と計算効率を実現し、スマートフォンを用いた大規模なスクリーニングツールの実用化可能性を示しました。
この論文は、単一細胞遺伝子発現データに対する生成モデルの評価における標準化の欠如と再現性の課題を解決するため、生物学的根拠に基づいた包括的な評価指標とオープンソースフレームワーク「GGE」を提案し、公平な比較と研究の加速を可能にすることを目的としています。
本研究は、統計熱力学に基づく離散列挙とマスク付きソフトマックス集約、およびストレートスルー勾配推定器を組み合わせた「DISCOMAX」という可微分アルゴリズムを提案し、熱力学的整合性を保証しつつ液体 - 液体平衡データからニューラルネットワークによる過剰ギブズエネルギーモデルを学習可能にする新たな枠組みを示しています。
この論文は、Klinkenberg 効果を含む非線形ガス流を Hopf-Cole 変換と混合定式化、共有トランク型ニューラルネットワーク、および DeepLS ソルバーを統合した機械学習フレームワークにより線形化し、圧力・速度場の高精度予測と圧力依存性透過率などの逆問題の効率的な推定を実現する手法を提案しています。
この論文は、単一ドメインデータで訓練されたモデルが直面する「ドメイン感度の崩壊」という幾何学的な欠陥を理論的に解明し、教師モデルからクラスに抑制された残差構造を蒸留する「教師誘導型学習(TGT)」を提案することで、推論時のオーバーヘッドを増やすことなく分布外検出性能を大幅に向上させる手法を提示しています。
この論文は、音声認識(ASR)の処理時間が音声の長さで正確に推定できるという知見に基づき、vLLM に最短処理時間優先(SJF)や最高応答率優先(HRRN)といったスケジューリングアルゴリズムを導入することで、負荷変動下でも尾部レイテンシの悪化を抑制しつつ最大 73% の中央値レイテンシ改善を実現する手法を提案しています。
本論文は、モデル学習過程における交差検証に基づく正則化の確率的性質が、ブラックボックス推定器を用いた文脈付きバンドット問題において、トンプソンサンプリングと理論的に同等の探索を自然に誘発することを示し、大規模実環境において従来の手法を上回る性能を達成する「RIE-Greedy」という新たな手法を提案している。
本論文は、状態空間モデルが生物学的な画像データにおける疎で不規則な時間プロセスを扱う際に直面する根本的な課題を明らかにするため、単一分子局在顕微鏡シミュレーションに基づく新たなベンチマーク「SMLM-C」を提案し、その評価結果を報告したものです。
この論文は、異なるドメイン間での分布のシフトに起因する PCA の不安定性に対処するため、複数のドメインにおける最悪ケース性能を最適化する「wcPCA」という統一的な枠組みを提案し、その理論的保証と実データへの適用による性能向上を実証しています。
この論文は、各クライアントのローカル訓練データから計算された PCA 統計量を用いて単一のグローバルモデルを条件付けることで、通信オーバーヘッドを増やすことなく、データのスパーシビリティや多次元の異質性を含むあらゆるフェデレーテッド学習のシナリオにおいて、真のクラスター割り当てを知るオラクル基準に匹敵、あるいは上回る性能を達成する手法を提案しています。
この論文は、対数損失を用いることで無限分散を持つ重尾データに対しても有効な主成分分析を提案し、重尾観測の主成分が潜在ガウス生成子の共分散行列に基づく標準 PCA と一致することを理論的に示すと同時に、背景ノイズ除去などの実験を通じて古典的 PCA や他のロバスト推定量を上回る性能を実証しています。
本論文は、臨床的に広く利用されている重み付け MRI 画像で事前学習した深層学習去ノイズモデルを物理モデルに統合する「MRI2Qmap」を提案し、真の定量画像データが不要なまま、圧縮センシングによるアーティファクトを低減した高精度な多パラメータ定量 MRI 再構成を実現する手法を提示しています。
この論文は、学習データから推定されたスコア関数に任意に小さな誤差が含まれる場合でも、高次元の単純な分布においてランジュバンダイナミクスが目標分布から遠く離れた分布を生成してしまうことを示し、拡散モデルに対するそのロバスト性の欠如を指摘しています。
この論文は、スパース報酬環境における強化学習の課題を解決するため、失敗時に教師デモンストレーションを適応的に注入し、モデルの改善に伴ってその依存度を自然に低下させることで、偏りのない勾配推定と教師の制約を超えた学習を可能にする「Hindsight-Anchored Policy Optimization (HAPO)」を提案するものである。
この論文は、過去のエピソードからの明示的な自己反省をコンテキストとして活用し、テスト時に探索戦略を適応的に改善する「MR-Search」というメタ強化学習フレームワークを提案し、複数のベンチマークで既存の強化学習手法を大幅に上回る性能を示したことを報告しています。
本論文は、システム生物学におけるデータ駆動型の動的方程式学習において、候補関数間の強い相関が数値的不安定性を引き起こす問題を検討し、直交多項式基底の選択とデータ分布の整合性がモデルの精度回復に重要であることを示しています。
この論文は、強制的なプロンプト注入が言語モデルの安全性を突破する成功率を、推論サンプル数に対して多項式成長から指数関数的成長へと転換させる現象を、スピンガラスモデルにおける磁場強度に応じた秩序相の出現という理論的枠組みで説明し、理論的導出と実証的検証の両面から示したものである。