SKG-Eval: Stateful Evaluation of Multi-Turn Dialogue via Incremental Semantic Knowledge Graphs
SKG-Eval は、構造化された状態追跡を通じて長距離の不一致や矛盾を検出するためにセマンティック知識グラフを逐次的に構築することにより多ターン対話システムを評価する新規かつ解釈可能なフレームワークであり、既存のフラットな指標やターンを孤立させた指標よりも人間の判断との相関を高める。
原著者が当サイトのやさしい解説を確認した論文。
このページに掲載されている各論文については、少なくとも一人の原著者が当サイトのやさしい解説を確認し、内容の正確性を認めるか、または修正を依頼しその修正を私たちが反映しています。確認は各文への正式な承認を意味するものではありませんが、論文を書いた本人たちの目を通ったことを意味します。
607 件の論文を著者が確認済み · 261–270 / 607
SKG-Eval は、構造化された状態追跡を通じて長距離の不一致や矛盾を検出するためにセマンティック知識グラフを逐次的に構築することにより多ターン対話システムを評価する新規かつ解釈可能なフレームワークであり、既存のフラットな指標やターンを孤立させた指標よりも人間の判断との相関を高める。
本論文は、内側に反発性のコアと外側に引力のテールを有する有限範囲ポテンシャルに対して、散乱長がポテンシャルの範囲を超える場合、有効範囲は厳密に正であり続けることを厳密に証明し、それによってエキゾチックハドロン構成を区別する際に有効範囲の符号を用いることへの根本的な制約を提供する。
本研究は密度汎関数理論を用いて、動的に安定な二次元同種二層 NbOX2(X=Cl、Br、I)材料が調整可能なバンドギャップ、高い異方性キャリア移動度、および強い可視光から紫外線への光吸収を示すことを実証し、これらが効率的な光触媒水分解のための有望な候補であることを明らかにする。
本論文は、分極化するニュースコンテンツがユーザーのエンゲージメントを確実に増加させる一方で、購読を促進せず、政治的に重要度の高い期間には離脱をむしろ悪化させることを示しており、デジタル出版業者にとって注意がコミットメントに等しくないという重要な経済的トレードオフを明らかにしている。
本論文は、2026 年の最先端モデル 5 種を用いて Spracklen らの 2025 年の LLM パッケージ幻覚に関する研究を再現・拡張し、幻覚発生率が大幅に低下しモデル間ばらつきが縮小した一方で、新たに特定されたモデル非依存の幻覚パッケージ名 127 件と、明確なクロスエコシステムおよびクロスモデルの行動パターンによって特徴づけられる持続的な脅威が残存していることを明らかにする。
本論文は、非線形電磁気学がマグネターにおける光子の伝播を著しく変化させ、推定される恒星半径に約 10% の誤差を生じさせ、かつ現在のミッション分解能を超える約 350 ナノ秒の系統的なタイミング遅延を誘発することを示しており、これにより高精度な中性子星の質量および半径測定に対して補正が不可欠であることを明らかにする。
本論文は、UAV ネットワーク向けに空間的に一貫した FR3 空中対地上チャネルマップを生成するために 3 次元建物の幾何学と影の投影を活用するスケーラブルな半決定論的伝播シミュレータ「UPSim」を導入し、高精度を維持しつつ移動性対応計画のためのフル・レイ・トレーシングに対する計算効率の高い代替手段を提供する。
本論文は、音声技術におけるウルドゥー語の資源不足という課題に対処するため、LLM 駆動型のパイプラインを通じて開発された、12 次元の副言語注釈と標準化されたベンチマークを備えた 156 時間のオーディオを含む大規模かつ高忠実度のウルドゥー語音声コーパス「UrduSpeech」を紹介するものである。
本論文は、2HDM シナリオにおける単一荷電ヒッグス粒子のような新物理信号の発見可能性を、従来のカット・アンド・カウント法と比較して向上させるため、MadAnalysis5 インターフェースを用いて観測量を体系的にランク付けしカットを選択する自動化された反復最適化手法を導入する。
本論文は、複数のコーデックおよびコンテンツタイプにわたる動画圧縮が時間的整合性に与える影響を体系的に評価し、時間的劣化が非線形パターンに従い、予測不能なダイナミクスを伴うシーケンスで不均衡に深刻であることを明らかにすることで、運動量のみがエンコードの難易度を決定するという仮説に疑問を呈する。