Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference
本論文は、大規模言語モデルの推論を高速化する KV キャッシュが入力情報を復元される深刻なプライバシー漏洩リスクを抱えていることを初めて実証し、モデル精度や性能をほぼ損なわずにこの脅威を無力化する軽量な防御手法「KV-Cloak」を提案するものです。
3852 件の論文
本論文は、大規模言語モデルの推論を高速化する KV キャッシュが入力情報を復元される深刻なプライバシー漏洩リスクを抱えていることを初めて実証し、モデル精度や性能をほぼ損なわずにこの脅威を無力化する軽量な防御手法「KV-Cloak」を提案するものです。
ゼロショット協調(ZSC)における既存のベンチマークである Hanabi 学習環境の限界を克服し、移動するカードの信念追跡や曖昧なヒントの推論など、より高度な協調能力を評価するための新たなオープンソースベンチマーク「Yokai 学習環境(YLE)」を提案し、HLE で最高性能を達成した手法が YLE では性能が低下することを示すことで、単一のベンチマークでの進捗が一般化しないことを実証した。
この論文は、記号的な STRIPS 行動モデルを行動の痕跡から学習し、既存のプランナーを用いて計画を可能にするかどうかを検証した研究であり、その結果、強固な記号的バイアスを持つ専用モデルよりも、スティックブレイキング注意機構を備えた標準的なトランスフォーマーの方が、訓練精度や一般化性能において優れていることを示しています。
本論文は、SigLIP モデルで採用されているシグモイド損失関数における可学習な逆温度とバイアスの同期が、-Constellations と呼ばれる新たな組合せ的構造を介して損失をゼロに導くことを理論的に解明し、これにより SigLIP の検索性能の成功や CLIP におけるモダリティギャップの存在、高品質な表現を得るための必要な次元数を説明するとともに、実験的にトレーニングダイナミクスを改善する損失関数の再パラメータ化を提案しています。
この論文は、推論言語モデルの性能とコストのトレードオフを解決するため、心理測定学に触発された軽量で解釈可能なルーティングフレームワーク「RADAR」を提案し、質問の難易度とモデルの能力を学習して最適なモデル・予算ペアに動的にルーティングすることで、最先端の手法を上回る性能と汎化能力を実証しています。
この論文は、大規模言語モデル(LLM)のツール選択における提供者偏りを特定し、その原因を分析した上で、関連ツールのフィルタリングと均一サンプリングによる偏り低減手法を提案するベンチマーク「BiasBusters」を提示するものである。
本論文は、採掘現場の監視映像から安全違反を直接検出する新しいビジョン・言語フレームワーク「MonitorVLM」を提案し、ドメイン固有のデータセット、条項フィルタ、行動拡大モジュールの導入により、既存の基盤モデルを大幅に上回る精度で安全監視の自動化を実現したことを示しています。
この論文は、ウェアラブル EEG による睡眠ステージ分類において、ラベル不足を克服し臨床レベルの精度を達成するために、教師なし学習(SSL)を体系的に評価し、汎用モデルを上回るドメイン特化型パイプラインの有効性を実証したものである。
この論文は、標準的な音声活動検出(VAD)モデルの特定の層に対してハイパーネットワークを用いてパーソナライズされた重みを生成する「HyWA」という手法を提案し、既存の条件付け手法と比較して精度の向上とアーキテクチャの再利用による展開の容易さを両立させることを示しています。
本論文は、クロスモーダル注意機構、Grad-CAM++ による帰属分析、および「提示 - 修正」フィードバックループを統合した説明可能なバイアス意識生成フレームワークを提案し、マルチモーダル MNIST やファッション MNIST などのベンチマークにおいて、高い精度、ロバスト性、公平性を達成したことを示しています。
本論文は、大規模データに依存せず多視点生成とカスタマイズ忠実性を両立させるため、幾何学的潜在レンダリングと補完技術を採用した新しい拡散モデル「MVCustom」を提案し、カメラポーズ制御とプロンプトベースのカスタマイズを幾何学的整合性を持って実現する手法を提示しています。
この論文は、実世界のデータセットにおけるカーネル回帰の学習曲線を、データ共分散行列と目標関数の多項式分解という 2 つの統計量のみから予測する「エルミート固有構造仮説(HEA)」を提案し、その有効性を理論的・実験的に実証するとともに、MLP の学習過程における Hermite 多項式の獲得にも言及しています。
この論文は、LLM 推論における KV キャッシュの効率的な管理を実現するため、PCA による特徴量非相関化、適応量子化、エントロピー符号化を組み合わせた軽量な変換符号化器「KVTC」を提案し、推論精度を維持しつつ最大 20 倍(特定用途では 40 倍以上)の圧縮率を達成し、既存の手法を上回るメモリ効率化を実現することを示しています。
この論文は、高温超伝導の分野における専門家の知識を評価基準として、6 つの LLM システムを比較検証し、キュレーテッド文献に基づく RAG 方式のシステムが既存のクローズドモデルを上回る包括的かつ証拠に裏打ちされた回答を提供できることを示しています。
本論文は、外部ツールの活用を促すために冷間起動と強化学習の 2 段階トレーニングを採用し、実世界のマルチモーダル推論を評価する RealX-Bench を導入することで、ツールを状況に応じて適応的に選択・組み合わせる自律型マルチモーダルモデル「DeepEyesV2」の構築とその有効性を示しています。
この論文は、条件付けされた変数の情報を明示的に除去する潜在フローマッチングに基づく「What We Don't C」という手法を提案し、生成モデルを用いて学習表現から捕捉されていない要因を解離・発見する新たなアプローチを示しています。
本論文は、周波数空間とピクセル空間の両方で勾配に基づいた適応的データ拡張を行う「D-GAP」を提案し、ドメインシフトに対する汎化性能を大幅に向上させる手法を提示しています。
本論文は、自動車テレメトリデータに見られる「緩やかなドリフト」と「急激なスパイク」という異なる時間スケールの動的特性を、双経路エンコーダとデコーダを用いて明示的に分離することで、既存手法よりも頑健な異常検知を実現する「STREAM-VAE」を提案しています。
遠隔 sensing 分野において、散在するドキュメントや複雑な制約条件による基盤モデルの選定課題を解決するため、160 以上のモデルを網羅する構造化データベース「RS-FMD」を構築し、自然言語クエリから制約条件を考慮して最適なモデルを自動選定・説明するエージェント「REMSA」を提案し、専門家の評価によるベンチマークでその有効性を実証した論文です。
本論文は、医療データにおけるプライバシー漏洩リスクに対処するため、医療概念の階層構造と幾何学的制約を統合し、特定知識の効率的な忘却と汎用医療能力の維持を両立させる階層的二重戦略のアンラーニング手法を提案し、MedMCQA や MHQA などのデータセットで高い忘却率と知識保持率を達成したことを示しています。