On the Theoretical Limitations of Embedding-Based Retrieval
本論文は、埋め込み次元によって表現可能な上位 k 個の文書集合の数が理論的に制限されることを示し、単純なクエリであっても最先端のモデルがこの制約により失敗することを実証することで、単一ベクトルパラダイムの根本的な限界を明らかにしている。
3735 件の論文
本論文は、埋め込み次元によって表現可能な上位 k 個の文書集合の数が理論的に制限されることを示し、単純なクエリであっても最先端のモデルがこの制約により失敗することを実証することで、単一ベクトルパラダイムの根本的な限界を明らかにしている。
本論文は、機械およびインフラシステムの劣化推論において、操作変動と劣化ダイナミクスを効果的に分離し、数値的効率と推論精度を向上させる階層制御微分方程式(H-CDE)フレームワークを提案しています。
この論文は、フローマッチングのベクトル場に対するリプシッツ定数の依存性を制御する仮定を明らかにし、対数凹性を必要としない高次元の非有界分布に対しても、従来の結果を改善する Wasserstein 距離における収束率を導出するものです。
本論文は、微調整や自然言語プロンプトなしで、テキスト学習済みの大規模言語モデル(LLM)が離散化された偏微分方程式(PDE)の解から時空ダイナミクスをゼロショットで外挿できることを示し、その精度が文脈長と出力長に依存するスケーリング則に従うとともに、トークンレベルの出力分布分析から「構文模倣」「高エントロピー探索」「数値的根拠に基づく予測」という 3 段階の文脈内学習メカニズムを明らかにしたものである。
本論文は、積分 KL 発散最小化に基づく理論的枠組みと、報酬正規化や中間状態マッチングなどの技術を採用した「DiDi-Instruct」という手法を提案し、事前学習済み離散拡散言語モデルから高速かつ高品質な生成が可能な少数ステップの学生モデルを効率的に蒸留する新たなアプローチを示しています。
この論文は、非微分可能かつ部分的にしか指定されていない前方演算子を持つ逆問題(例えば歩行軌道からの間取り復元)において、従来の勾配に基づくガイダンスが不安定になる課題を解決するため、対照学習で学習した埋め込み空間内で疑似尤度スコアを計算し、拡散モデルの事後分布サンプリングを安定化させる「CoGuide」という手法を提案しています。
本論文は、最適輸送によって誘起されるリーマン幾何構造を持つワッサーシュタイン空間におけるブセマン関数の存在と計算可能性を研究し、1 次元分布およびガウス測度に対する閉形式解を導出することで、確率分布の射影やガウス混合モデル・ラベル付きデータセットにおける新しいスライス・ワッサーシュタイン距離の定義、ならびにその転移学習などへの応用を可能にした。
この論文は、2 人の競合する証明者(1 人は誠実)からなる「審査付き学習」の枠組みを提唱し、特に高精度なモデル選択タスクにおいて、従来の単一証明者や証明者なしの手法を大幅に凌駕する効率性と精度を達成するプロトコルを構築し、その最適性を示す下限を証明したものである。
この論文は、視覚・意味・幾何学的特徴を統合し、各モダリティの不確実性を推定することで、任意の環境にゼロショットで適用可能な汎用的なニューラル特徴フィールド「UniFField」を提案し、ロボットの頑健な意思決定を可能にする手法を提示しています。
この論文は、不確実性下での公平な意思決定を可能にするため、対称化手法を用いて保護属性への介入を考慮した予測集合を生成し、反事実的公平性と marginal 被覆性を両立させる「反事実的公平な適合予測(CF-CP)」という新しい枠組みを提案し、その有効性を理論的および実証的に示しています。
LLM と進化アルゴリズムを組み合わせるオープンソースフレームワーク「CodeEvolve」は、計算コストを大幅に削減しつつ、AlphaEvolve などの既存手法を凌駕する最先端のアルゴリズム発見能力を実現します。
この論文は、圏論、石炭代数、量的論理、および最適輸送を統合し、確率システムの振る舞い的擬距離の-商を普遍性を持つ標準的な抽象化として確立することで、確率領域における量的状態抽象化と表現学習の厳密な理論的基盤を提供するものである。
本論文は、ゼロ次最適化が継続学習における忘却を抑制する一方で学習能力を低下させるトレードオフを明らかにし、安定性と可塑性の両立を実現する効率的な手法「ZO-FC」を提案しています。
この論文は、ベイズ的観点からプロンプトによる文脈内学習と内部活性化の操作という一見異なる LLM 制御手法を、それぞれ「証拠の蓄積」と「概念の事前確率の変更」として統一的に説明する予測モデルを提案し、両者の相加性や急激な行動変化など新たな現象を予測可能にしました。
本論文は、継続学習向けに推論と学習の両方を効率的に支援するため、マイクロスケーリング(MX)形式の乗算累積演算において既存の設計が抱える精度と効率のトレードオフを解決するハイブリッドな精度スケーラブルな削減木を提案し、SNAX プラットフォームへの統合を通じて MXINT8、MXFP8/6、MXFP4 各形式で高エネルギー効率と高スループットを実現したことを報告するものである。
本論文は、トランスフォーマーベースの Producer-Refiner 構造と共収束軌道の反復的洗練を採用し、3D 血管中心線の抽出においてトポロジの正確性と精度を向上させつつ、既存の最先端手法に比べて推論を高速化しパラメータ数を大幅に削減する「RefTr」というフレームワークを提案しています。
本論文は、低ランクテンソル分解に基づく高次クロスモーダル相互作用の効率的な捉え方と、競合する目的関数間の勾配競合を緩和するパレート最適方向への更新制御を組み合わせることで、対話におけるマルチモーダル感情認識の精度と訓練の安定性を向上させる「Cross-Space Synergy(CSS)」という統合フレームワークを提案し、IEMOCAP および MELD データセットにおいて既存手法を上回る性能を実証したものである。
この論文は、単一ドメインデータでの教師あり学習が情報ボトルネック最適化によりドメイン特徴の崩壊を引き起こし、分布外検出を破綻させるという理論的メカニズムを情報理論的に解明し、事前学習表現を用いたドメインフィルタリングによる解決策を提案するものです。
本論文は、樹木ベースのアンサンブル学習と分布回帰を組み合わせたカスタム AutoML 手法を開発し、暴力紛争の将来発生確率分布を推定することで、従来の点予測の限界を克服し、PRIO-GRID 月次レベルでの 1 年先までの予測精度を向上させることを示しています。
この論文は、過剰パラメータ化されたニューラルネットワークにおいて、損失が平坦な経路が存在するにもかかわらず最適化が単一の盆地に閉じ込められるというパラドックスを、曲率の変動と最適化ノイズの相互作用によって生じるエントロピー障壁(曲率誘起のエントロピー力)によって説明し、これが解の局在化を支配していることを明らかにしています。