Telogenesis: Goal Is All U Need
この論文は、外部の報酬に依存せず、無知・驚き・陳腐化という3つの認知的ギャップから優先度を内生的に生成する「Telogenesis」を提案し、これが固定戦略を上回る適応性を示すだけでなく、環境の隠れた変動構造を教師なしで回復できることを実証しています。
2393 件の論文
この論文は、外部の報酬に依存せず、無知・驚き・陳腐化という3つの認知的ギャップから優先度を内生的に生成する「Telogenesis」を提案し、これが固定戦略を上回る適応性を示すだけでなく、環境の隠れた変動構造を教師なしで回復できることを実証しています。
この論文は、大規模言語モデルを活用した進化アルゴリズムを用いて PDDL で記述された古典的計画タスク向けの汎用的なプランナーを自動生成する「GenePlan」という新しいフレームワークを提案し、既存の最先端プランナーと同等の性能を発揮しながら、他の LLM ベースの手法を大幅に上回る結果を示したことを報告しています。
本論文は、人間と生成 AI の相互作用が「ツール」や「協働」を超えた「第三の存在」としての新たな認知・認識論的形態を生み出し、その非反射的な「雰囲気創造(vibe-creation)」と非対称的創発の概念を通じて、教育や知の再定義を迫る理論的枠組みを提示している。
この論文は、過去の観測値に基づいて正常な時系列データの確率分布を正確にモデル化し、低確率事象を検出することで多変量時系列の異常検知を可能にする「時系列条件付き正規化フロー(tcNF)」という新しい枠組みを提案し、その有効性を検証したものである。
本論文は、事前学習されたビジョン・言語モデルの知識を維持しつつ少量データで効果的に適応させるため、プロンプトの進化経路を明示的に制御し、方向性を保持しながら更新を行う「EvoPrompt」という新しいフレームワークを提案するものである。
本論文は、特定ドメインでファインチューニングされたターゲットモデルに対するスペキュレイティブデコーディングの性能低下を、パラメータとデータの両面で効率的にドラフトモデルを適応させる新フレームワーク「EDA」により解決し、再学習コストを大幅に削減しながら平均受入長を向上させることを提案しています。
この論文は、ビッグファイブの性格特性に基づいて大規模言語モデル(LLM)にパーソナライズされたデマ訂正メッセージを生成させる手法を提案し、同様に性格特性をシミュレートした別の LLM を評価者として用いることで、パーソナライズされたメッセージが一般のメッセージよりも説得力が高いことを実証するとともに、その技術的有用性と倫理的課題を明らかにしています。
本論文は、Mamba-2 の状態空間双対性アルゴリズムを XLA の最適化パスに直接マッピングすることで、CUDA 固有のカーネルに依存せず CPU、NVIDIA GPU、Google Cloud TPU 単一ソースから実行可能なポータブルかつ のオートレグレイシブキャッシングを実現し、TPU 上で高い性能と精度を確認したことを報告しています。
本論文は、オンライン継続学習の課題に対処するため、現代ホップフィールドネットワークに着想を得たエネルギーベースの連想検索層をトランスフォーマーに統合し、反復的な勾配最適化なしに動的にタスク固有の表現部分空間を選択する「Routing without Forgetting(RwF)」という新しいアーキテクチャを提案し、クラス増加ベンチマークにおいて既存のプロンプトベース手法を大幅に上回る性能を示したことを報告しています。
この論文は、エネルギー保存と作用の極値の原理に基づき、時間連続的な神経ネットワークにおける誤差伝播を生物学的に妥当な局所学習則として導出する「変分潜在平衡」の一般形式を提案し、逆伝播法(BPTT)の生物学的実装と物理回路の設計指針を提供するものである。
この論文は、単なるプロンプト設計を超えて、エージェントの意思決定環境を設計・管理する「コンテキストエンジニアリング」を中核とし、意図設計や仕様設計と統合した新たな成熟度モデルを提案し、大規模マルチエージェントシステムの展開における課題を解決する枠組みを提示しています。
本論文は、リモートセンシング分野における合成データの解釈可能な生成と評価を可能にするビジョン・言語統合フレームワークを提案し、実画像と合成画像、セグメンテーションマップ、説明文を含む大規模データセット「ARAS400k」を構築することで、合成データを用いた拡張学習が実データのみを用いた学習よりも高い性能を発揮することを示しました。
LLM エージェントが知識の検索劣化やルール合成の困難さ、古くなった知識の検出に直面する課題に対し、確定的なルール検索、ベイズ推論に基づく矛盾認識メモリ、そしてパレート最適化を用いたプロンプト進化ループ「COMPASS」を統合した PRECEPT 枠組みが、テスト時適応において大幅な性能向上と頑健性を達成することを示しています。
本論文は、顧客体験管理におけるパーソナ適応を考慮した双制御環境下でのマルチモーダルエージェントの堅牢性を評価するため、FOCAL の成果を踏まえて 12 の新規指標を提案し、GPT-5 や GPT-4.1 などの最先端モデルを用いた電信・小売分野での評価結果を示す MM-tau-pベンチマークを提案するものです。
LLM による静的テキストから動的 HTML アプリケーション(MiniApp)への生成シフトを評価するため、実世界データに基づくベンチマーク「MiniAppBench」と、ブラウザ自動化を用いたエージェント評価フレームワーク「MiniAppEval」を提案し、現在の LLM が高品質な MiniApp 生成において依然として課題を抱えていることを明らかにした論文です。
この論文は、動画編集における背景の整合性と前景の品質向上という課題に対し、拡散モデルの「ハルシネーション(幻覚)」を検知して動的にキー・バリューの融合比率と CFG スケールを調整する学習不要なフレームワーク「KV-Lock」を提案し、既存手法を上回る結果を示しています。
この論文は、時系列異常検出におけるグラフニューラルネットワーク(GNN)の応用を促進し、再現性のある実験と評価を可能にするオープンソースフレームワークを提案するとともに、その有効性と解釈性の向上、および評価手法に関する重要な課題を明らかにしています。
この論文は、ドキュメント、画像、音声・映像ストリームを統一的に扱う「Omni Parsing」フレームワークを提案し、検出・認識・解釈の 3 段階のプロセスと証拠に基づく論理的推論を通じて、非構造化データを追跡可能な構造化知識へ変換する「Logics-Parsing-Omni」モデルとベンチマーク「OmniParsingBench」を開発したことを報告しています。
LLM が既存のコード生成ベンチマークで示す高い性能が単なる暗記に過ぎない可能性を指摘し、学習データとして希少なエソテリック言語を用いた新規ベンチマーク「EsoLang-Bench」を提案し、先行モデルが真の推論能力において著しく劣ることを実証した。
本研究は、高齢者の心血管リスク管理における手動コーディングの限界を克服するため、3,482 人の患者の非構造化電子健康記録を用いて、従来の機械学習や生成 LLM、および構造化データとの融合手法を比較評価し、長距離依存性を捉えることに特化したカスタム Transformer 構造が最も高い性能を示したことを明らかにしました。