Stochastic Self-Organization in Multi-Agent Systems

この論文は、エージェントが独立して応答を生成し、シャープレー値の近似を用いて相互の貢献度を評価することで、追加の教師信号や学習なしに動的な通信構造(DAG)を自己組織化し、特に弱い LLM 環境下でも頑健な性能を発揮するマルチエージェントフレームワーク「SelfOrg」を提案するものである。

Nurbek Tastan, Samuel Horvath, Karthik NandakumarTue, 10 Ma🤖 cs.LG

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

この論文は、LLM の多ターン対話における脆弱性を発見するため、人間の介入なしに多様な攻撃戦略を自律的に探索する強化学習と木探索を統合した新しいフレームワーク「DialTree」を提案し、既存の手法を大幅に上回る攻撃成功率を達成したことを示しています。

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan RothTue, 10 Ma🤖 cs.LG

Idiom Understanding as a Tool to Measure the Dialect Gap

この論文は、フランス語の地域方言(特にケベック方言)の理解度を測定する新たなベンチマークデータセットを構築し、大規模言語モデルの多くが標準語には精通しているもののケベック方言のイディオム理解において顕著な能力格差を示すことを実証しました。

David Beauchemin, Yan Tremblay, Mohamed Amine Youssef, Richard KhouryTue, 10 Ma💬 cs.CL

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

本論文は、大規模マルチモーダルモデルをモジュール単位で分解し、SoC 内の最適なアクセラレータに動的に割り当てるハードウェア・ソフトウェア協調設計フレームワーク「NANOMIND」を提案し、バッテリー駆動の小型デバイス上で高効率かつ低消費電力なオンデバイス推論を実現したことを示しています。

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman BanerjeeTue, 10 Ma💬 cs.CL

ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall

この論文は、多段推論における中間的な暗黙の主題がクエリニューロンとして機能し、値ニューロンを順次活性化して情報を蓄積するメカニズムを解明し、このニューロンレベルの帰属分析に基づいて既存の手法を大幅に上回る性能を発揮する知識編集フレームワーク「ACE」を提案するものである。

Jiayu Yang, Yuxuan Fan, Songning Lai, Shengen Wu, Jiaqi Tang, Chun Kang, Zhijiang Guo, Yutao YueTue, 10 Ma💬 cs.CL

HypoSpace: Evaluating LLM Creativity as Set-Valued Hypothesis Generators under Underdetermination

この論文は、科学的推論における「不確定性」の条件下で、LLM が単一の正解ではなく複数の仮説セットを生成する能力を評価するための診断スイート「HypoSpace」を提案し、従来の正解率ベースの評価では見逃されるモード崩壊の現象を明らかにしています。

Tingting Chen, Beibei Lin, Zifeng Yuan, Qiran Zou, Hongyu He, Anirudh Goyal, Yew-Soon Ong, Dianbo LiuTue, 10 Ma💬 cs.CL

KrishokBondhu: A Retrieval-Augmented Voice-Based Agricultural Advisory Call Center for Bengali Farmers

この論文は、ベトナム語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。 ※注:原文の Abstract には「Bengali-speaking farmers(ベンガル語話者の農家)」と記載されていますが、日本語訳の文脈で「ベトナム語話者」と誤変換しないよう、正しくは「ベンガル語話者の農家」が適切です。以下に修正版を提示します。 **修正版:** この論文は、ベンガル語話者の農家向けに、音声認識、RAG(検索拡張生成)技術、および大規模言語モデルを統合し、電話を通じてリアルタイムで専門的な農業アドバイスを提供する「KrishokBondhu」と呼ばれるシステムを提案し、その有効性を示したものである。

Mohd Ruhul Ameen, Akif Islam, Farjana Aktar, M. Saifuzzaman RafatTue, 10 Ma💬 cs.CL

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed は、Rust 製で静的トークン埋め込みルックアップを採用した実運用向けシステムであり、1.12 ミリ秒の超低遅延と 5 万リクエスト/秒の高スループットを実現しつつ、重複検出や意味的類似性タスクにおいて Sentence-BERT と同等かそれ以上の性能を発揮します。

Edouard Lansiaux, Antoine Simonet, Eric WielTue, 10 Ma💬 cs.CL

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

本論文は、人間の研究者の基礎論文を基に仮説立案から実験、論文執筆までを自律的に行う「Jr. AI Scientist」を開発し、その科学的貢献と評価結果を報告するとともに、現在の AI 科学者システムが抱えるリスクや限界を包括的に分析したものである。

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu AizawaTue, 10 Ma🤖 cs.LG

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection

本論文は、明示的および暗黙的なヘイトスピーチの検出において、少量の例から得られる「HatePrototypes(クラスレベルのベクトル表現)」を用いることで、従来の継続的ファインチューニングなしにタスク間での転移学習やパラメータ不要の早期退出を可能にし、効率的かつ解釈可能なモデリングを実現することを示しています。

Irina Proskurina, Marc-Antoine Carpentier, Julien VelcinTue, 10 Ma💬 cs.CL

SPOT: An Annotated French Corpus and Benchmark for Detecting Critical Interventions in Online Conversations

本論文は、オンライン議論を中断または方向転換させる「クリティカルな介入」を検出するための初の注釈付きフランス語コーパス「SPOT」を構築し、文脈メタデータを活用した微調整エンコーダーモデルがプロンプト型大規模言語モデルを上回る性能を示すことを実証したものです。

Manon Berriche, Célia Nouri, Chloée Clavel, Jean-Philippe CointetTue, 10 Ma💬 cs.CL

Process-Centric Analysis of Agentic Software Systems

この論文は、エージェント型ソフトウェアシステムの意思決定過程を構造的に解析する「Graphectory」を導入し、その分析に基づいて実行中のエージェントをリアルタイムで監視・介入させることで、問題解決率の向上と実行経路の効率化を実現する手法を提案しています。

Shuyang Liu, Yang Chen, Rahul Krishna, Saurabh Sinha, Jatin Ganhotra, Reyhan JabbarvandTue, 10 Ma💬 cs.CL

Parallel Decoder Transformer: Planner-Seeded Latent Coordination for Synchronized Parallel Decoding

本論文は、事前学習済みデコーダ型言語モデルに「プランナーによる潜在ワークスペース」と「同期マルチストリーム出力プロトコル」を組み合わせた「並列デコーダ・トランスフォーマ(PDT)」を提案し、外部のオーケストレーションに依存せず、モデル内部で並列タスク分解と生成の同期を可能にする新しいアーキテクチャを示しています。

Logan RobbinsTue, 10 Ma💬 cs.CL

CompanionCast: Toward Social Collaboration with Multi-Agent Systems in Shared Experiences

本論文は、スポーツ観戦などの共有体験において、単一のAIではなく複数の専門エージェントを協調させる「CompanionCast」フレームワークを提案し、その実証研究を通じて社会的存在感や感情の共有を向上させることを示しています。

Yiyang Wang, Chen Chen, Tica Lin, Vishnu Raj, Josh Kimball, Alex Cabral, Josiah HesterTue, 10 Ma💬 cs.CL

Adaptation of Agentic AI: A Survey of Post-Training, Memory, and Skills

本論文は、LLM エージェントの事前学習後の適応を「エージェント側」と「ツール側」の 4 つのパラダイムに分類する統一的な枠組みを提示し、事後学習、記憶、スキルに関する研究を包括的にレビューするとともに、そのトレードオフや評価手法、および将来の課題を論じています。

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, Zifeng Wang, Luxi He, Yichen Wu, Ming Zhong, Peiyang Song, Qizheng Zhang, Heng Wang, Xueqiang Xu, Hanwen Xu, Pengrui Han, Dylan Zhang, Jiashuo Sun, Chaoqi Yang, Kun Qian, Tian Wang, Changran Hu, Manling Li, Quanzheng Li, Hao Peng, Sheng Wang, Jingbo Shang, Chao Zhang, Jiaxuan You, Liyuan Liu, Pan Lu, Yu Zhang, Heng Ji, Yejin Choi, Dawn Song, Jimeng Sun, Jiawei HanTue, 10 Ma💬 cs.CL