AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents
本論文は、長期対話における事実の断絶や状態更新の競合といった課題を解決し、LoCoMo 評価でマルチホップ推論の精度を大幅に向上させるとともに、推論時間を約 78% 削減する構造化メモリシステム「AriadneMem」を提案するものである。
154 件の論文
本論文は、長期対話における事実の断絶や状態更新の競合といった課題を解決し、LoCoMo 評価でマルチホップ推論の精度を大幅に向上させるとともに、推論時間を約 78% 削減する構造化メモリシステム「AriadneMem」を提案するものである。
本論文は、医療分野における推論の精度向上とハルシネーションの抑制を目的として、候補回答間の「矛盾」を検知し、外部証拠の取得と内部推論履歴の最適化を反復的に行うマルチラウンド・エージェンティック RAG フレームワーク「MA-RAG」を提案し、7 つの医療 Q&A ベンチマークで平均 6.8 ポイントの精度向上を実現したことを報告しています。
本論文は、認知科学の知見に基づきエピソード的記憶を抽象的な知識グラフとして構造化し、任意の LLM エージェントにタスク固有の設計変更なしに接続可能な汎用的なメモリモジュール「PlugMem」を提案し、複数のベンチマークで既存の手法を上回る性能と高い情報密度を実現したことを報告しています。
この論文は、州交通機関の知識管理と workforce 訓練の課題を解決するため、専門エージェントによる多段階処理と図表の視覚言語モデル変換を組み合わせた検索拡張生成(RAG)フレームワークを提案するものである。
本研究は、LLM による意味分析と VARK 学習スタイルに基づく認知プロファイリングを統合したハイブリッド枠組みを提案し、ユーザーやアイテムのデータ不足というコールドスタート問題を解決し、初期接触段階からパーソナライズされた推薦を可能にすることを目的としています。
本論文は、LLM の長期記憶管理におけるコストと精度のトレードオフを解決するため、タスク成果に基づく報酬を用いた強化学習で最適化された小型プロキシモデルに記憶検索をオフロードする新フレームワーク「MemSifter」を提案し、既存の最先端手法を上回る性能を達成したことを示しています。
この論文は、連想記憶の検索とグラフラプラシアン平滑化を結合したエネルギー関数を導入し、勾配降下による反復更新でノード分類を改善する「グラフホップフィールドネットワーク」を提案し、特に疎な引用ネットワークや特徴マスク下での頑健性向上、および異種性グラフへの適応性を示しています。
本論文は、LLM ベースの対話型推薦システムにおける個人ごとの安全制約(トラウマや恐怖症など)の侵害という新たな脆弱性を特定し、これを評価する新規ベンチマーク「SafeRec」と、推薦精度と個人化された安全性の両立を可能にするトレーニングフレームワーク「SafeCRS」を提案するものである。
LLM エージェントの選定を体系的に支援する初の統一ベンチマーク「AgentSelect」は、大規模なクエリとエージェントの相互作用データを提供し、流行度ベースの手法の限界を克服する能力に特化したマッチング手法の学習と評価を可能にします。
本論文は、推薦システムの前順位付け段階における訓練データの異質性による勾配競合と計算効率の課題を解決するため、サンプルの難易度に応じた最適化経路と計算リソースの動的配分を行う「HAP」フレームワークを提案し、実システムでの導入により追加コストなしでユーザーエンゲージメントを向上させたことを報告しています。
この論文は、共有アカウントにおけるユーザー数を固定せず、頻度領域からの行動分離と潜在推論の 2 段階アプローチを採用することで、共有アカウントシーケンシャル推薦の精度を大幅に向上させる「DisenReason」を提案し、複数のベンチマークで最先端手法を上回る性能を示したことを報告しています。
本論文は、機械学習や大規模オーディオ言語モデルの進展に伴う音楽情報検索における主観的な注釈の課題を解決するため、カスタムモデルを接続可能なコンテナ化されたバックエンドを備えたオープンソースの協調型自動タグ付けツール「LabelBuddy」を提案するものである。
本論文は、大規模な非構造化知識とツールの協調を必要とする複雑な金融サポートワークフローを評価する新たなベンチマーク「-Knowledge」を導入し、最先端モデルでさえも正確な情報検索と複雑なポリシー推論において大幅な課題を抱えていることを示しています。
この論文は、YouTube 上のアフィリエイトマーケティングに関する 10 年間の大規模データ分析を通じて、FTC の開示基準への非遵守が深刻な課題であることを明らかにし、プラットフォームによる標準化された開示機能の導入がコンプライアンス向上に有効であると提言しています。