Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms
この論文は、教育分野の専門用語の曖昧さを解消し事実性を高めるため、エンティティリンキングとハイブリッド再ランク付けを統合した「ELERAG」と呼ばれる新しい RAG アーキテクチャを提案し、ドメイン固有のデータセットにおいて従来の手法を上回る性能を実証したものである。
2385 件の論文
この論文は、教育分野の専門用語の曖昧さを解消し事実性を高めるため、エンティティリンキングとハイブリッド再ランク付けを統合した「ELERAG」と呼ばれる新しい RAG アーキテクチャを提案し、ドメイン固有のデータセットにおいて従来の手法を上回る性能を実証したものである。
本論文は、無線ネットワークにおける周波数選択的な電磁界(EMF)予測の信頼性を高めるため、多様な文脈情報を統合し不確実性を明示的に評価できる条件付き拡散モデル「EMFusion」を提案し、既存の手法を上回る精度と確率予測性能を実証したものである。
この論文は、大規模言語モデルに代わり、Hugging Face TRL を用いて 3 億 5000 万パラメータの小型言語モデルを単一のエポックで微調整した結果、ToolBench 評価で ChatGPT や ToolLLaMA などの基線モデルを大幅に上回る 77.55% の成功率を達成し、コスト効率の高い生成 AI の実用化が可能であることを示しています。
本論文は、大規模言語モデルエージェントの継続的な自己改善を可能にするため、タスク連鎖を通じてスキルを蓄積・活用し、報酬設計を強化する強化学習フレームワーク「SAGE」を提案し、AppWorld における実験で既存手法を上回る精度と効率を達成したことを報告しています。
本論文は、高次元空間におけるユークリッド距離と測地線の不一致という課題を解決するため、局所内次元性(LID)を用いてデータの内在的幾何構造に動的に適応するマンフォールド整合グラフインデックス「MCGI」を提案し、数十億規模のディスク常駐ベクトル検索において既存手法を大幅に上回るスループットと低遅延を実現したことを報告しています。
本論文は、従来の活性化量に基づく手法の限界を克服し、ターゲット言語への予測への機能的貢献度を評価する介入ベースのフレームワーク「CRANE」を提案することで、多言語大規模言語モデルにおける言語固有のニューロンをより精密に特定し、言語選択的かつ非排他的な専門化の存在を実証するものである。
本論文は、任意の条件付き推論を可能にするため、単一の生成モデルを学習し事後予測区間による不確実性を定量化する「ベイズ生成モデル(BGM)」という新しい枠組みを提案し、その収束性と統計的整合性などの理論的保証を示したものです。
この論文は、衛星メガコンステレーション時代における宇宙機電源システムの包括的健康管理を実現するため、人間と AI の協調(HAIC)フレームワーク「SpaceHMchat」を提案し、ハードウェア実機による検証と初の公開データセットの提供を通じてその有効性を立証したものです。
本論文は、FFA と ICGA の両方の眼科血管造影画像に対して、ハイパーネットワークに基づく適応的条件付け層(HaC)と証拠的不確実性学習に基づく信頼性予測スキーム(RaP)を導入した CLEAR-Mamba を提案し、既存手法を上回る汎用性と信頼性を実現したものである。
この論文は、LLM 駆動の Web 研究エージェントを用いて、人間によるキュレーションを上回る品質で多様な予測質問を自動生成・解決し、AI 予測モデルの評価と予測精度の向上を実現するシステムを提案するものである。
この論文は、自己進化型合成データ生成エンジン「EigenData」と検証器に基づく強化学習を組み合わせた統合フレームワークを提案し、高品質な多ターン対話ツール利用データの自動生成と効率的な学習を実現することで、人手を介さずに複雑なツール利用行動をスケーラブルに習得できることを示しています。
この論文は、スライス単位の構造検出を並列に行う検出ヘッドを統合し、その出力でセグメンテーション予測を制御するゲート付きマルチヘッド・トランスフォーマー・アーキテクチャを提案することで、解剖学的に存在しないスライスにおける偽陽性(ハルシネーション)を効果的に抑制し、放射線治療における自動セグメンテーションの信頼性と解剖学的妥当性を大幅に向上させることを示しています。
本論文は、事前学習済みトランスフォーマーの重みを修正することなく、モンテカルロドロップアウトを用いてアテンション機構にエピステミック不確実性を組み込む「UAT-LITE」を提案し、分布外データにおける選択的予測性能の向上と予測の不確実性の改善を実現するものです。
この論文は、WCAG2 の違反を検知し、元のデザインを維持しながら HTML を自動修正する「WebAccessVL」という視覚言語モデルを提案し、その手法が既存モデルを大幅に上回る高い精度でウェブサイトのアクセシビリティを改善できることを実証しています。
この論文は、チャットボットへの信頼が規範的な信頼性ではなく、認知バイアスを巧みに利用した設計によって形成される「営業職」的な側面に基づいていることを指摘し、心理的信頼と規範的信頼性の混同を解きほぐすための研究と支援の必要性を提唱しています。
この論文は、単一画像からの法線推定における 3 次元位置の不一致問題を解決するため、法線推定を画像生成モデルを用いたシェーディングシーケンス推定として再定義し、合成データで学習した RoSE という手法を提案し、実世界ベンチマークで最先端の性能を達成したことを報告しています。
この論文は、インフルエンス関数を用いてトレーニングデータに微小な編集を加えることで、モデルの動作を意図的に誘発・制御する「Infusion」というフレームワークを提案し、画像および言語タスクにおいてその有効性とアーキテクチャ間での転移性を示しています。
この論文は、経験再生、学習可能なリーキー・インテグレート・アンド・ファイア(LIF)ニューロンパラメータ、および適応型スパイクスケジューラを統合したエネルギー意識スパイク予算枠組みを提案し、フレームベースおよびイベントベースの両方のデータセットにおいて、精度向上とエネルギー効率の最適化を同時に実現するスパイクニューラルネットワークの継続学習手法を開発したものである。
この論文は、拡散モデルの推論遅延を軽減しつつ中間軌道の構造情報を保持するために、教師の軌道の各離散ステップに対応する複数のブランチを備えた学生モデルを提案し、密な軌道アライメントを通じて生成品質を向上させる「B-DENSE」と呼ばれる新しいフレームワークを紹介しています。
この論文は、複数の介入に対して単一のオントロジー状態空間を再利用する古典的モデルが、文脈依存性を完全に記述するために追加の文脈情報が必要となるという情報理論的な不可能定理を証明し、量子理論がこの制約を回避する仕組みを明らかにしています。