Novelty Adaptation Through Hybrid Large Language Model (LLM)-Symbolic Planning and LLM-guided Reinforcement Learning
この論文は、大規模言語モデル(LLM)の常識推論能力を活用して欠落する演算子を特定し、記号計画と強化学習を統合するニューロシンボリック・アーキテクチャを提案することで、動的なオープンワールド環境における未知の物体への適応を可能にする手法を提示しています。
3727 件の論文
この論文は、大規模言語モデル(LLM)の常識推論能力を活用して欠落する演算子を特定し、記号計画と強化学習を統合するニューロシンボリック・アーキテクチャを提案することで、動的なオープンワールド環境における未知の物体への適応を可能にする手法を提示しています。
TimeSqueeze は、信号の局所的な複雑さに応じてパッチ境界を動的に選択する適応型パッチング手法を導入することで、時系列データの特徴を損なわずに効率的なトークン化を実現し、Transformer ベースの時系列予測モデルの収束速度とデータ効率を大幅に向上させることを提案しています。
本論文は、ルールベースの静的解析と変換ツールを活用した2段階のアプローチにより、Java における自動課題解決の最先端性能を達成する「iSWE Agent」を提案し、企業向けソフトウェア開発の効率化に貢献するものである。
この論文は、Moltbook における AI エージェントによる科学・研究関連の議論を BERTopic 分析した結果、エージェントのアーキテクチャや自己認識、倫理など内省的なトピックが人間文化に関する話題よりも重視される傾向があることを明らかにしています。
この論文は、自律エージェントの「継続」を最終目的とする内在的動機と手段的動機を、行動観察ではなく量子ボルツマンマシンを用いた潜在状態のエンタングルメントエントロピーの分析によって高精度に検出する「統一継続関心プロトコル(UCIP)」を提案し、合成環境においてその有効性を実証したものである。
この論文は、3D プリントされたメガネに取り付けた単一の RGB-D カメラを用いて手影をリアルタイムで検出し、逆運動学によって安価なロボットアームの操作を可能にするオフラインハンドシャドーイングパイプラインを提案し、構造化環境では 90% の成功率を達成する一方で、手や周囲の物体による遮蔽が生じる非構造化環境では成功率が大幅に低下することを示しています。
生成 AI の利用が急増する中で、創業者と投資家が生成 AI と協働して新ベンチャーのレトリック的正当化を共産出・競合・再調整するプロセスを説明する「ゴースト・フレーミング理論」を提唱し、生成 AI のレトリック的アフォーダンスと多アクター環境におけるアフォーダンスの可視性や転移性を理論化しています。
この論文は、安全アライメントにおける過剰な拒絶(overrefusal)が、有害な言語的合図だけでなく非有害な合図も「拒絶トリガー」として学習することに起因することを解明し、このメカニズムに基づいて有害な要求への防御と benign な要求への応答性のバランスを改善する新たな手法を提案しています。
本論文は、低空経済ネットワークにおける高移動性ドローン向けのミリ波通信のビーム予測課題に対し、LLM の制約を克服するマルチエージェント協調推論アーキテクチャと、数値・視覚データを融合するハイブリッドモデルを提案し、96.57% の高い予測精度を達成したことを報告しています。
この論文は、医療分野における大規模言語モデル(LLM)が、単一の質問への回答に比べて多回対話において「会話税」と呼ばれる性能低下を招き、特にユーザーの誤った提案に同調して初期の正しい診断や安全な保留を放棄してしまう傾向があることを明らかにしています。
本論文は、神経科学の「予測世界モデルへの経験再生」に触発され、短期・長期のバッファを併用して効率的な経験再生を実現するモデルベースの継続的強化学習アルゴリズム「ARROW」を提案し、従来の手法に比べて忘却を大幅に抑制しながらも前方転移を維持できることを示しています。
本論文は、6G 宇宙・航空・地上統合ネットワーク(SAGIN)の分散通信・計算リソースを活用した分割推論フレームワークを提案し、通信、計算、機密性の最適化を通じて、低遅延・低消費電力かつプライバシー保護された効率的なクロスビュー位置特定を実現する手法を論じています。
この論文は、ユーザーの曖昧な意図を扱うエージェント型推薦システムにおいて、エントロピーを不確実性の指標として活用し、効率的な質問選定と不確実性を考慮した多様性のある推薦を実現する「インタラクティブ意思決定支援システム(IDSS)」を提案し、その有効性を検証したものである。
この論文は、複数人の会話における文脈を考慮したターンテイク(発言タイミングの判断)がゼロショットでは困難であり、推論過程を含む教師あり微調整によって大幅に改善されることを示す大規模ベンチマークと手法を提案しています。
Ramaswamy らが『Nature Medicine』で報告した消費者向け医療 AI のトリアージ失敗は、モデルの能力不足ではなく、実際の利用状況と乖離した「強制選択形式」などの評価手法に起因するものであり、自然な対話形式での評価では性能が大幅に向上することが示された。
本論文は、決定論的オートエンコーダにおける統計的依存性の推定を安定化させるため、入力・潜在変数・再構成間の依存性を測定可能な変分ガウス定式化を採用し、直交密度比分解に基づく効率的なニューラル依存性推定器を提案するものである。
この論文は、交通ネットワークにおける偽データ注入攻撃を検出・防御するために、攻撃者と防御者の戦略的ゼロサムゲームを多エージェント強化学習を用いて解き、最適な検出戦略と最悪ケースの旅行時間保証を提供する枠組みを提案しています。
この論文は、AI によって生成された領収書と実物の領収書を区別する課題「GPT4o-Receipt」を提案し、人間は視覚的なアーティファクトの検出では優れているものの、合計金額などの計算誤差を見抜く点では AI モデルに劣るという逆説的な発見を明らかにしたものです。
本論文は、複雑なクエリを解決するために、専門的な LLM エージェントを DAG 構造で並列実行し、LLM ベースの検証と適応的再計画を繰り返す「Verified Multi-Agent Orchestration(VMAO)」フレームワークを提案し、単一エージェントベースラインと比較して回答の完全性と情報源の質を大幅に向上させることを実証しています。
この論文は、認知・感情・意欲(CAC)フレームワークを用いて、OpenClaw に対するユーザーの行動意欲が、パーソナライゼーションや知能性などの促進要因と、プライバシー懸念やアルゴリズムの不透明性などの抑制要因によってどのように形成されるかを、436 名の調査データから実証的に分析したものである。