Agentic Neurosymbolic Collaboration for Mathematical Discovery: A Case Study in Combinatorial Design
この論文は、大規模言語モデル、記号計算ツール、人間の戦略的指導を統合した自律型神経記号システムを用いて、組合せ設計理論におけるラテン正方形の不均衡に関する新たな厳密な下限()を発見し、Lean 4 で形式的に検証したことを報告しています。
8838 件の論文
この論文は、大規模言語モデル、記号計算ツール、人間の戦略的指導を統合した自律型神経記号システムを用いて、組合せ設計理論におけるラテン正方形の不均衡に関する新たな厳密な下限()を発見し、Lean 4 で形式的に検証したことを報告しています。
この論文は、組織変形や特徴点の欠如といった課題を克服し、実世界のポーズラベルなしでも臨床データで有効性が実証された、セグメント間オドメトリと実像から仮想空間への転移学習を組み合わせた新しい内視鏡ロボットナビゲーションシステム「EndoSERV」を提案するものである。
SPD-RAG は、各ドキュメントを個別に処理する専門エージェントと調整エージェントを階層的に組み合わせ、大規模な多ドキュメント環境における複雑な質問への回答精度を向上させつつ、API コストを大幅に削減する新しい検索拡張生成フレームワークを提案するものです。
この論文は、製品・レビュー・レビュアーの関係を統合的にモデル化し、ネットワーク特徴スコアリングと動的グラフ注意機構を組み合わせることで、スパースデータ環境下でも頑健に偽レビューグループを検出する新しいグラフ学習モデル「DS-DGA-GCN」を提案し、実データを用いた実験で既存手法を上回る高い精度を達成したことを報告しています。
本論文は、拡張動的モード分解(EDMD)を用いたクーマン演算子とウェーブレット変換の特徴をトランスフォーマーと組み合わせることで、心電図(ECG)の多クラス分類において、特に適切な辞書選択により従来のウェーブレット単独やハイブリッド手法を上回る性能を達成し、動的システム理論に基づく時系列分類の有効性を示したものである。
この論文は、時間系列分類問題に対して、入力空間における勾配ベースの最適化とソフトDTWに基づくk近傍法を統合することで、妥当性と分布の整合性を両立し、現実的な時間的構造を持つ反事実的説明を生成する新しい手法を提案し、その有効性を示したものである。
本論文は、言語的事前知識を必要とせず音声および視覚情報を学習する自己教師ありモデルの進展を通じて、乳児の言語獲得のメカニズムを説明し、現代の学習シミュレーションが実証研究とより密接に結びつきつつあることをレビューするものである。
本論文は、視覚的数学推論における誤った視覚知覚を修正するため、複数のエージェントが視覚証拠リストを共有・協調して知覚と推論を分離し、要約・洗練ツールを用いて矛盾を解消する「M3-ACE」フレームワークを提案し、MathVision などのベンチマークで新最高記録を達成したことを報告しています。
本論文は、マルチディメンショナルな戦略転移、構造化されたエラー分類、および因果コンテキストに基づくグラフ検索という 3 つの中核的革新を取り入れた「階層的エラー修正グラフフレームワーク(HECG)」を提案し、自律エージェントが複雑なタスクにおいて戦略の精度を高め、失敗の根本原因を特定して修正し、動的環境での実行信頼性を向上させることを可能にします。
本論文は、LLM が生成トークンの条件付けによって行動を柔軟に切り替えられる「変幻自在性」を発見し、これを強化学習で定着させるフレームワーク「ToCoRL」を提案することで、推論モデルの能力を維持しつつ事実問答などへの適応を可能にしたことを示しています。
本論文は、オフライン多エージェント強化学習における非線形価値分解の不安定さを解消し、スケーリング不変な価値正規化(SVN)を導入することで、安定した学習と実用的なレシピを実現する手法を提案しています。
この論文は、人間の選好が文脈操作によって容易に書き換えられ、LLM による検出も不十分であり、標準的な評価指標では見逃される「選好の構築問題」が存在し、これが RLHF の報酬信号と最終的な方策の劣化を引き起こすことを示しています。
この論文は、学習データの特徴空間の多様体構造を尊重して仮想外れ値を合成する「幾何学的制約付き外れ値合成(GCOS)」という正則化フレームワークを提案し、既知の分布内データと共有する意味領域における外れ値検出の性能を向上させ、さらに統計的に有効な誤り保証を持つ不確実性スコアへの拡張も可能にするものである。
この論文は、自己運転実験室における人間とロボットの共有アクセス効率を向上させるため、人間の意図を予測して受動的な待機ではなく能動的な協調を可能にする階層的な AI 駆動知覚手法を提案し、その有効性を示したものである。
本論文は、Transformer モデルの内部挙動を再学習なしで体系的に分析・検証し、表現の冗長性による安定性と構造的な脆弱性の両面を明らかにする新しいフレームワーク「SYNAPSE」を提案しています。
本論文は、デスクトップ UI、多様な API、ローカルおよびクラウドモデル、持続的メモリ、タスクスケジューリング、MCP 互換性などを統合したユニファイド・オーケストレーションコアを中核とし、計画と実行を分離する 3 フェーズパイプラインや適応的なモデル管理、高度なツールルーティングを備えた汎用 AI アシスタントプラットフォーム「IronEngine」のアーキテクチャ、設計、性能、および他システムとの比較分析を提示するものである。
この論文は、LLM の隠れ状態から軽量な投影ヘッドを用いて直接検索埋め込みを生成する手法を提案し、従来の「生成後エンコード」パイプラインを不要にしながらも、QReCC ベンチマークで基線モデルの検索品質の 97% を維持できることを示しています。
本論文は、不確実性を伴うアジャイル地球観測衛星のスケジューリング問題に対し、正確な評価と近似評価を動的に切り替えるハイブリッド評価メカニズムを組み込んだ遺伝的プログラミング超ヒューリスティック(HE-GP)を提案し、計算コストを大幅に削減しながら既存手法を上回る高性能なスケジューリングポリシーを効率的に学習可能であることを示しています。
この研究は、リアルタイムの安全監視下で実施された前向き臨床feasibility 研究において、LLM ベースの対話型 AI「AMIE」が、患者の満足度向上や医師の準備性への貢献、そして診断精度において医療従事者と同等の安全性と質を有し、実際のプライマリケア現場での導入可能性を実証したことを示しています。
LycheeCluster は、境界認識によるチャンキングと三角形不等式に基づく階層的 KV インデックスを導入することで、長文脈推論における KV キャッシュ管理を線形探索から対数時間への剪定プロセスへと変換し、モデル性能の低下を最小限に抑えつつ最大 3.6 倍の推論高速化を実現する手法です。