ContextBench: Modifying Contexts for Targeted Latent Activation
この論文は、言語モデルの特定の潜在特徴や動作を誘発する入力生成手法を「文脈修正」として定式化し、その能力と安全性への応用を評価するベンチマーク「ContextBench」を提案するとともに、LLM 支援や拡散モデルによる修正を加えた進化型プロンプト最適化(EPO)が、誘発効果と言語的流暢さのバランスにおいて最先端のパフォーマンスを達成することを示しています。
333 件の論文
この論文は、言語モデルの特定の潜在特徴や動作を誘発する入力生成手法を「文脈修正」として定式化し、その能力と安全性への応用を評価するベンチマーク「ContextBench」を提案するとともに、LLM 支援や拡散モデルによる修正を加えた進化型プロンプト最適化(EPO)が、誘発効果と言語的流暢さのバランスにおいて最先端のパフォーマンスを達成することを示しています。
本論文は、ノイズやハードウェア制約に直面する実用的な量子ハードウェアにおいて、変分パラメータの最適化を不要としつつ、浅い量子特徴マップを反復的に結合するハイブリッド量子古典フレームワーク「反復量子特徴マップ(IQFMs)」を提案し、量子畳み込みニューラルネットワークや古典的ニューラルネットワークと同等以上の性能を実現する手法を提示しています。
この論文は、機械学習を用いて系の力学的な作用(action)を学習し、対称性と時間可逆性を保つ構造保存マップを構築することで、分子動力学シミュレーションの長時間ステップ化におけるエネルギー保存や等分配則の破れといった問題を解決し、異なる熱力学的条件や化学組成へも転用可能な高精度な積分手法を提案するものである。
本論文は、自己教師あり学習の VICReg 目的関数を再生核ヒルベルト空間に拡張した「Kernel VICReg」を提案し、非線形構造のデータやサンプル数が限られる環境において、従来のユークリッド空間ベースの手法よりも優れた表現学習とモデルの崩壊防止を実現することを示しています。
本論文は、球面テンソル表現の複雑さを回避し、スカラーおよびテンソル物理量を統一的に扱うための新しい「テンソル原子クラスター展開(TACE)」手法を提案し、その分子・材料分野における高精度、安定性、および汎用性を示したものである。
この論文は、多施設研究におけるパラメータの不均質性を検出し、要約統計量に基づく多変量コクラン型検定とブートストラップ法を組み合わせた「センターのクラスター(CoC)」アルゴリズムを開発し、真のセンター分類を高い確率で回復できることを理論的に証明するとともに、シミュレーションと実データ分析でその有効性を示したものである。
本論文は、非因果的アテンションマスクを因果的に変更してドラフトトークンを生成し、モデル統合型のスペキュレイティブサンプリング機構により並列検証を行う「自己スペキュレイティブ・マスクド拡散」を提案し、離散データ生成における標準的なマスクド拡散モデルと比較して、ネットワークの順伝播回数を約半分にするのに成功したことを報告しています。
本論文は、外部の検証器(人間や高性能モデル)による合成データの検証プロセスを導入することで、モデル崩壊を回避し短期的な性能向上を実現できる一方、長期的には検証器の知識中心に収束し、検証器の完全な信頼性がなければ初期の改善が頭打ちや逆転する可能性があることを、理論と実験を通じて明らかにしています。
この論文は、カテゴリカルデータおよび混合データにおけるクラスタ内の属性分布の違いを反映して距離を適応的に更新する「クラスタカスタマイズ適応距離指標(CADM)」を提案し、14 のデータセットで平均順位 1 位を達成する高い有効性を示したものである。
DAISI は、流に基づく生成モデルと逆サンプリング手法を組み合わせて、複雑な非線形ダイナミクスや疎な観測条件下でも従来の手法を上回る精度で状態推定を可能にする、スケーラブルなデータ同化アルゴリズムを提案するものである。
本論文は、強い相互作用が存在する際に平均化によって相互作用効果が隠蔽されるという Partial Dependence Plot(PDP)の限界を克服するため、Individual Conditional Expectation(ICE)曲線に基づく新たなグローバル感度指標を提案し、その数学的性質の証明と航空宇宙設計などの実例における PDP や SHAP 等との比較を通じて、その有効性を示したものである。
この論文は、複数のデータソースを統合して最適な個別化治療ルール(ITR)を推定する際の問題である事後シフトに対処するため、事前情報に基づく分布ロバストなアプローチ(PDRO-ITR)を提案し、その閉形式解の導出、適応的な調整手順、および理論的なリスク保証を示すとともに、シミュレーションと実データ分析を通じて既存手法を上回る性能を実証しています。
この論文は、ラベル付きデータが少なく無ラベルデータが豊富な環境下で、ブラックボックス予測モデルを活用して条件付き平均などの統計的推論を行う新たな手法を提案し、その有効性と高精度な信頼区間を理論的・実験的に証明するものである。
本論文は、脳活動と行動の関係を解明し、内部計算と行動生成を分離して大規模神経集団のダイナミクスを捉えるために、行動によって部分的に制約された分解型線形ダイナミカルシステムモデル「behavior-dLDS」を提案し、シミュレーションデータおよびゼブラフィッシュの記録データにおける有効性を示したものである。
この論文は、ランダム特徴量リッジ回帰を用いた弱教師から強学生への転移学習において、教師モデルのテスト誤差がサンプルサイズに対して減少しなくても、学生モデルが教師の性能を大幅に上回り、最小最大最適収束率を達成しうることを示しています。
この論文は、マルチアームバンディットアルゴリズムの比較実験において、既存の手法に比べて実験コストを大幅に削減し、推定量の分散を抑制する新しい実験設計「人工リプレイ(Artificial Replay)」を提案し、その理論的性質と実証的有効性を示したものである。
本論文は、無限チャネル極限における畳み込みニューラルネットワーク(CNN)の重みにガウス事前分布を仮定した場合の条件付き共分散行列および事後分布に対して、初めて大偏差原理(LDP)を確立し、ネットワークのガウス等価性や共分散の集中に関する証明を簡素化したものである。
この論文は、ガウス表面積がの概念クラスに対するアグノスティック学習の多項式次数の上限を、既存のからへと改善し、統計的クエリモデルにおける多項式閾値関数の学習複雑性に対してほぼ最適な結果をもたらすことを示しています。
この論文は、神経科学に着想を得た確率的潜在変数モデルである予測符号化グラフ(PCG)が、多層パーセプトロンの数学的超集合を定義することを証明し、これにより PCG を現代の機械学習の文脈に位置づけ、ニューラルネットワークのトポロジーに関する研究を強化していることを示しています。
本論文は、softmax ベースのモデル(特にトランスフォーマーの自己注意機構の中核)における勾配流のダイナミクスを解析し、最適化が本質的に低エントロピーの出力へと収束する普遍的なメカニズムを明らかにし、これが「アテンション・シンク」や「巨大な活性化」といった実証的な現象を理論的に説明することを示しています。