When Machine Learning Gets Personal: Evaluating Prediction and Explanation
医療などの高リスク分野において、個人化が予測精度と説明性の両方に与える影響を統一的に定量化する枠組みを提案し、個人化の効果が統計的に検出可能かどうかを決定づけるデータセットの特性や限界を実証的に明らかにしています。
2167 件の論文
医療などの高リスク分野において、個人化が予測精度と説明性の両方に与える影響を統一的に定量化する枠組みを提案し、個人化の効果が統計的に検出可能かどうかを決定づけるデータセットの特性や限界を実証的に明らかにしています。
この論文は、セミバリューに基づくデータバリュエーションの有用性選択への依存性を解決するため、データポイントを低次元空間に埋め込む「空間的署名」の概念を導入し、有用性の変化に対する結果の堅牢性を定量化する実用的な手法を提案しています。
この論文は、視覚と固有受容感覚に基づいて可変性線形物体(DLO)の物理パラメータの事後分布を推定し、これをドメインランダム化に活用することで、シミュレーションで学習した制御ポリシーを微調整なしで実世界にゼロショット展開可能にする統合フレームワークを提案しています。
この論文は、特徴量の分散に基づいて寄与を調整する「特徴量重要度再スケーリング(FIR)」という手法を提案し、ノイズや無関係な特徴量が多い高次元データにおけるクラスタリングの妥当性指標の信頼性と地正解との相関を向上させることを示しています。
この論文では、表形式データ向けに設計されたハイパーネットワークベースの分類モデル「HyConEx」を提案し、予測結果と並行して決定根拠を説明する対照的説明(counterfactual explanations)を生成する、予測と説明を統合した画期的な深層学習モデルを紹介しています。
本論文は、混合整数線形計画法を用いて分類および回帰タスクにおける線形サポートベクターマシンを葉ノードに持つモデルツリーを最適に学習する手法を提案し、貪欲法や他の機械学習モデルとの比較を通じて、極めて小規模な木構造で高い精度を達成できることを実証している。
この論文は、機械学習のバイナリ分類評価における決定論的視点の重要性を説き、適切なスコアリング則(ブライアースコアなど)の活用を提唱するとともに、実務との乖離を埋めるための理論的枠組み、クリップド・ブライアースコアの導出、および実用的な Python パッケージ「briertools」の提供を通じて、臨床的有用性を含む評価手法の改善を提案しています。
本論文は、CLIP エンコーダのクロスモーダル埋め込みの球面線形補間(SLERP)を用いた「概念ドリフト」メカニズムと、事前学習済み言語モデルの適応型 LayerNorm 微調整を組み合わせた新しい効率的なフレームワーク「CDGLT」を提案し、マルチモーダル比喩の識別において既存の生成手法よりも計算コストを大幅に削減しながら最先端の性能を達成することを示しています。
本論文は、GRPO における「すべてが不正解なグループ」からの学習欠如を解消するため、ステップごとの評価モデルを用いて回答の多様性を確保し、誤った推論からも学習可能にする「Stepwise Guided Policy Optimization(SGPO)」を提案し、その有効性を理論的および実証的に検証したものです。
この論文は、連続的な潜在変数モデルの限界を克服し、離散的で構造化された表現を可能にするため、隠れユニットを q 状態のカテゴリカル(ポッツ)単位に拡張した「ガウス - マルチノイリ制限付きボルツマン機械(GM-RBM)」を提案し、その理論的導出と実用的な学習手法を詳述するとともに、記憶容量やパラメータ数を同等に設定した比較実験を通じて、アナロジー想起や構造化記憶タスクにおいて従来のガウス - ベルヌーイ RBM と同等以上性能を発揮することを実証しています。
本論文は、モデルの重みや生成プロセスへのアクセスを必要とせず、API 経由で利用可能なブラックボックス環境下でも、予測されたトークンの対数確率(トップ 5)のみを操作する軽量プラグイン「BiasNet」を用いて大規模言語モデルの安全性を突破する手法「JULI」を提案し、既存の最先端手法を上回る効果を実証しています。
この論文は、対称性不変量を原子単位として利用することで、既知の物理法則を遵守し、かつ効率的かつ正確に微分方程式をデータから発見する新しい手法を提案し、流体や反応拡散系などへの適用を通じてその有効性を実証しています。
本論文は、従来の手法に比べて高速かつ低リソースで、200 万回以上の編集を可能にする「UltraEdit」という新しいモデル編集手法と、それを評価するための大規模ベンチマーク「UltraEditBench」を提案し、大規模言語モデルの安全でスケーラブルな生涯学習の実現に向けた重要な一歩を踏み出したことを示しています。
本論文は、エッジデバイス上での大規模言語モデル(LLM)の評価手法を体系化し、約 3.5 ビット/重み(BPW)を閾値として高ビット精度の小型モデルよりも重く量子化された大規模モデルの方が優位であることを示し、リソース制約環境における最適化ガイドラインを提示しています。
この論文は、スケーラビリティ、検証可能性、難易度の制御という既存の強化学習タスクの課題を解決するため、充足可能性問題(SAT)に基づき段階的な難易度制御とルールベースの検証を実現する強化学習フレームワーク「SATURN」を提案し、これにより大規模言語モデルの推論能力を大幅に向上させることを示しています。
本論文は、合成データではなく実世界の構造と大規模スケールに焦点を当てた新しいベンチマーク「FrontierCO」を提案し、16 の機械学習ソルバーを古典的ソルバーと比較評価することで、大規模かつ構造的に複雑な問題において機械学習手法と古典的手法の間に依然として大きな性能差が存在することを明らかにしています。
本論文は、ラベル付きデータが限られる状況でも安定したカバレッジ保証を実現するため、ラベル付き・ラベルなしデータの両方を用いた半教師ありコンフォーマル予測手法「SemiCP」を提案し、その理論的収束性と実験による有効性を示すものである。
この論文は、正解の集合が無限になり得る純粋探索問題に対して、既存手法の限界を明らかにし、漸近最適性を保証する新たなフレームワーク「Sticky-Sequence Track-and-Stop」を提案するものである。
この論文は、大規模言語モデル(LLM)の事前学習で得られた知識を活用し、メタ学習と signSGD を組み合わせて多様なドメインにまたがる時系列データの品質を効率的かつ高精度に評価する新しいフレームワーク「TSRating」を提案し、その有効性を検証したものです。
本論文は、協力型マルチエージェント強化学習におけるクレジット割り当て問題に対し、協力ゲーム理論の「コア」に基づく利得配分手法 CORA を提案し、エージェント間の連合貢献を適切に評価することで協調的な最適行動を促進し、既存手法を上回る性能を実現することを示しています。