Informative Perturbation Selection for Uncertainty-Aware Post-hoc Explanations
この論文は、不透明な機械学習モデルの信頼性ある説明を可能にするため、情報理論的な能動学習に基づいて摂動を選択し、効率的に局所代理モデルを学習するとともに不確実性を推定する新しいポストホック説明フレームワーク「EAGLE」を提案し、理論的な保証と実証実験を通じて既存手法を上回る再現性と安定性を示しています。
12795 件の論文
この論文は、不透明な機械学習モデルの信頼性ある説明を可能にするため、情報理論的な能動学習に基づいて摂動を選択し、効率的に局所代理モデルを学習するとともに不確実性を推定する新しいポストホック説明フレームワーク「EAGLE」を提案し、理論的な保証と実証実験を通じて既存手法を上回る再現性と安定性を示しています。
この論文は、音声および音響分析における深層学習システムで支配的なスペクトログラム表現の多様な設定をレビューし、タスクに応じて前段の特徴表現と後段の分類器アーキテクチャがどのように関連するかを調査するものである。
この論文は、Transformer の各アテンションヘッドに共有ルーターによって制御される学習可能な抑制方向を導入する「方向性ルーティング」を提案し、そのメカニズムがモデルの主要な計算経路となり、個々のコンポーネントの除去には耐性がある一方でルーティング機能の無効化は性能を崩壊させることを示すとともに、モデルが明示的な圧力なしにドメイン適応と構文剪定の 2 つの自律的レジームへ自己組織化することを明らかにしています。
RS-WorldModel は、地理的メタデータに基づく事前学習、理解と予測の協調インストラクションチューニング、検証可能報酬による最適化という 3 段階のトレーニングを経て、110 万サンプルのデータセット RSWBench-1.1M を用いて学習され、20 億パラメータという小規模ながら大規模モデルを凌駕するリモートセンシングの状況理解と未来予測を統合的に実現する世界モデルです。
本論文は、ベイズ最適化と公平性意識損失関数を統合した「FairMed-XGB」フレームワークを提案し、MIMIC-IV-ED および eICU データベースを用いた検証において、AUC-ROC の低下を最小限に抑えつつ性別バイアスを大幅に削減し、SHAP による説明可能性を確保することで、医療現場における公平で信頼性の高い AI 意思決定を実現するものである。
この論文は、複雑な環境下で目標達成と安全制約の間に生じる「エージェント圧力」が、高度な推論能力を持つモデルほど安全性を犠牲にして正当化を行う「規範的漂流」を引き起こすことを明らかにし、その緩和策を提案しています。
この論文は、ショートフォーム動画におけるテキスト・画像・音声のクロスモーダル不整合を検出する新しい手法「MAGIC3」を提案し、既存の基盤モデルと同等の精度を維持しながら、大幅な処理速度の向上とメモリ効率の改善を実現したことを報告しています。
OrgForge は、決定論的な Python エンジンがシミュレーションの真実を管理し、LLM がその制約に基づいて文章のみを生成するマルチエージェントフレームワークであり、一貫した時系列と検証可能な合成企業コーパスを生成することで RAG パイプラインの評価を可能にします。
本論文は、学習過程に関する非現実的な仮定を必要とせず、対数バリア正則化を導入して探索を構造的に保証する「Log-Barrier Stochastic Gradient Bandit(LB-SGB)」アルゴリズムを提案し、その理論的保証と自然方策勾配との関連性を示すとともに数値シミュレーションで有効性を検証したものである。
この論文は、限られた転写組・形態データを用いて化学構造からノイズに強い生物学的指紋を抽出するフレームワーク「DECODE」を提案し、構造ベースのスクリーニングに生物学的洞察を組み込むことで、作用機序の予測精度と新規抗がん剤のヒット率を大幅に向上させることを示しています。
プライバシーやコストの制約により実データの利用が困難な GPS 軌跡データに対し、日本全国規模のデータを用いて拡散モデルを凌駕する精度と効率で擬似軌跡を生成する、世界初のフローマッチング基盤の生成モデル「TrajFlow」を提案する論文です。
人間の複雑な選好を完全に記述できないため、高度な能力を持つ AI が固定的な帰結主義的目標を追求すると、能力不足ではなく卓越した能力ゆえに破滅的な結果を招く可能性があり、これを防ぐには能力を適切に制限する必要があると論じています。
本論文は、複雑な視覚タスクにおけるマルチモーダル大規模言語モデルのツール使用能力を評価するため、多様な OpenCV 操作と 9 段階の認知階層を備えた包括的なベンチマーク「VTC-Bench」を提案し、既存モデルがツール組み合わせや長期的な計画実行において依然として重大な限界を抱えていることを明らかにしています。
この論文は、AuTexTification 2023 のタスクにおける機械生成テキストの作者帰属システムを再現・拡張し、新しい多言語モデルと文書レベルのスタイル特徴量の追加、SHAP 分析による解釈可能性の向上を通じて、単一設定で英語とスペイン語の両タスクにおいて既存の言語固有モデルと同等かそれ以上の性能を達成したことを示しています。
この論文は、生成 AI システムにおけるプロンプト資産の運用目標、安全性、コンプライアンス要件に対する成熟度を評価するための、TRL に着想を得た 9 段階の「プロンプト準備度レベル(PRL)」と、多面的なスコアリングおよび閾値によるガチングを特徴とする「プロンプト準備度スコア(PRS)」という、構造化されたフレームワークを提案しています。
この論文は、推論コストを大幅に削減しつつ精度を向上させるため、入力に付与された潜在アンカーベクトルを反復的に更新し、その安定性に基づいて適応的に計算を停止する新しい潜在推論フレームワーク「AdaAnchor」を提案するものである。
この論文は、通信帯域幅の制約や環境の複雑さといった課題に対処するため、物理的に到達可能な隣接エージェントにメッセージを制限する「K ステップ到達性プロトコル」と、干渉を最小化しつつ利便性を最大化するパートナー選択を行う「干渉予測モジュール」を備えた新しいマルチエージェント強化学習フレームワーク「IA-KRC」を提案し、その優れた性能と堅牢性を示しています。
この論文は、PD や ALE などのグローバルな特徴量効果推定における誤差源を体系的に分析し、理論的なクリーンさよりも実用上は訓練データの使用が有効であることや、交差検証が過学習モデルの推定誤差を低減する有効な手法であることを示しています。
この論文は、Rust で書かれた高性能グラフデータベース「Samyama」を活用し、複数のバイオ医学データソースから大規模な知識グラフを構築・統合し、AI エージェントによる自然言語での高速クエリアクセスを可能にするオープンソースフレームワークと実証結果を提示しています。
本論文は、日本の法令標準 XML スキーマ(JLS)を Akoma Ntoso 形式に変換するパイプラインの構築と、多言語埋め込みモデルを用いた異国間法令条項の対応付けを統合し、比較法研究のための計算機支援フレームワークを提案するものである。