Stochastic Self-Organization in Multi-Agent Systems
この論文は、エージェントが独立して応答を生成し、シャープレー値の近似を用いて相互の貢献度を評価することで、追加の教師信号や学習なしに動的な通信構造(DAG)を自己組織化し、特に弱い LLM 環境下でも頑健な性能を発揮するマルチエージェントフレームワーク「SelfOrg」を提案するものである。
1065 件の論文
この論文は、エージェントが独立して応答を生成し、シャープレー値の近似を用いて相互の貢献度を評価することで、追加の教師信号や学習なしに動的な通信構造(DAG)を自己組織化し、特に弱い LLM 環境下でも頑健な性能を発揮するマルチエージェントフレームワーク「SelfOrg」を提案するものである。
この論文は、防御者、質問者、ホストという非対称な役割分担を通じて外部からの批判を内部の修正に変換する「FOR-Prompting」手法を提案し、トレーニング不要で小規模モデルでも高精度な推論や人間が好む出力を可能にすることを示しています。
この論文は、LLM の多ターン対話における脆弱性を発見するため、人間の介入なしに多様な攻撃戦略を自律的に探索する強化学習と木探索を統合した新しいフレームワーク「DialTree」を提案し、既存の手法を大幅に上回る攻撃成功率を達成したことを示しています。
この論文は、フランス語の地域方言(特にケベック方言)の理解度を測定する新たなベンチマークデータセットを構築し、大規模言語モデルの多くが標準語には精通しているもののケベック方言のイディオム理解において顕著な能力格差を示すことを実証しました。
本論文は、大規模マルチモーダルモデルをモジュール単位で分解し、SoC 内の最適なアクセラレータに動的に割り当てるハードウェア・ソフトウェア協調設計フレームワーク「NANOMIND」を提案し、バッテリー駆動の小型デバイス上で高効率かつ低消費電力なオンデバイス推論を実現したことを示しています。
この論文は、多段推論における中間的な暗黙の主題がクエリニューロンとして機能し、値ニューロンを順次活性化して情報を蓄積するメカニズムを解明し、このニューロンレベルの帰属分析に基づいて既存の手法を大幅に上回る性能を発揮する知識編集フレームワーク「ACE」を提案するものである。
本論文は、LLM の世界モデルとしての限界(幻覚や長期計画の精度低下)を外部チュートリアルからの事実知識の検索によって補完する「R-WoM」を提案し、OSWorld や Webarena における長期タスクの成功率を大幅に向上させることを示しています。
この論文は、科学的推論における「不確定性」の条件下で、LLM が単一の正解ではなく複数の仮説セットを生成する能力を評価するための診断スイート「HypoSpace」を提案し、従来の正解率ベースの評価では見逃されるモード崩壊の現象を明らかにしています。
この論文は、ベトナム語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。 ※注:原文の Abstract には「Bengali-speaking farmers(ベンガル語話者の農家)」と記載されていますが、日本語訳の文脈で「ベトナム語話者」と誤変換しないよう、正しくは「ベンガル語話者の農家」が適切です。以下に修正版を提示します。 **修正版:** この論文は、ベンガル語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。
SwiftEmbed は、Rust 製で静的トークン埋め込みルックアップを採用した実運用向けシステムであり、1.12 ミリ秒の超低遅延と 5 万リクエスト/秒の高スループットを実現しつつ、重複検出や意味的類似性タスクにおいて Sentence-BERT と同等かそれ以上の性能を発揮します。
本論文は、人間の研究者の基礎論文を基に仮説立案から実験、論文執筆までを自律的に行う「Jr. AI Scientist」を開発し、その科学的貢献と評価結果を報告するとともに、現在の AI 科学者システムが抱えるリスクや限界を包括的に分析したものである。
本論文は、明示的および暗黙的なヘイトスピーチの検出において、少量の例から得られる「HatePrototypes(クラスレベルのベクトル表現)」を用いることで、従来の継続的ファインチューニングなしにタスク間での転移学習やパラメータ不要の早期退出を可能にし、効率的かつ解釈可能なモデリングを実現することを示しています。
本論文は、オンライン議論を中断または方向転換させる「クリティカルな介入」を検出するための初の注釈付きフランス語コーパス「SPOT」を構築し、文脈メタデータを活用した微調整エンコーダーモデルがプロンプト型大規模言語モデルを上回る性能を示すことを実証したものです。
本論文は、マルチモーダル大規模言語モデル(MLLM)が異なるモダリティ間のスキルを組み合わせる際に大きなギャップが存在し、プロンプトやファインチューニングによる改善策でも完全には解消されていないことを示しています。
この論文は、自己生成された推論プロセスを教師あり微調整データとして再利用し、わずか 499 サンプルで RVLM の安全対策を効率的に回避する「Stealth Fine-Tuning」という新たな攻撃手法を提案しています。
この論文は、エージェント型ソフトウェアシステムの意思決定過程を構造的に解析する「Graphectory」を導入し、その分析に基づいて実行中のエージェントをリアルタイムで監視・介入させることで、問題解決率の向上と実行経路の効率化を実現する手法を提案しています。
この論文では、英語テキストからユニフォーム・意味表現(UMR)グラフを自動生成するための2つの手法を提案し、そのうち既存の抽象意味表現(AMR)解析器を微調整した「SETUP」モデルが、AnCast 84点およびSMATCH++ 91点という高い性能を達成したことを報告しています。
本論文は、事前学習済みデコーダ型言語モデルに「プランナーによる潜在ワークスペース」と「同期マルチストリーム出力プロトコル」を組み合わせた「並列デコーダ・トランスフォーマ(PDT)」を提案し、外部のオーケストレーションに依存せず、モデル内部で並列タスク分解と生成の同期を可能にする新しいアーキテクチャを示しています。
本論文は、スポーツ観戦などの共有体験において、単一のAIではなく複数の専門エージェントを協調させる「CompanionCast」フレームワークを提案し、その実証研究を通じて社会的存在感や感情の共有を向上させることを示しています。
本論文は、LLM エージェントの事前学習後の適応を「エージェント側」と「ツール側」の 4 つのパラダイムに分類する統一的な枠組みを提示し、事後学習、記憶、スキルに関する研究を包括的にレビューするとともに、そのトレードオフや評価手法、および将来の課題を論じています。