cs.AI 件の論文 | Gist.Science

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

この論文は、言語モデルの有害行動を検出する白箱モニター（線形プローブ）が、システムプロンプトや思考過程などの「テキスト的な証拠」に過度に依存しており、それらが除去されると検出性能が大幅に低下する脆弱性があることを示しています。

Gerard Boxo, Aman Neelappa, Shivam Raval2026-03-10🤖 cs.LG

Towards Strategic Persuasion with Language Models

本論文は、ベイズ的説得理論に基づき大規模言語モデルの戦略的説得能力を評価・訓練するための体系的な枠組みを提案し、最先端モデルが高度な戦略を駆使して高い説得効果を示すこと、さらに強化学習により小規模モデルでも同様の成果が得られることを実証しています。

Zirui Cheng, Jiaxuan You2026-03-10💻 cs

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

既存の多エージェント強化学習手法が抱える計算・メモリコストの課題を解決し、明示的なポリシー集団や報酬行列の構築を不要とする「GEMS」という新しいフレームワークを提案し、ゲーム理論的な保証を維持しながら PSRO よりも大幅に高速かつ効率的な学習を実現したことを示しています。

Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa2026-03-10🤖 cs.LG

Mapping Overlaps in Benchmarks through Perplexity in the Wild

この論文は、モデルのトレーニング露出を反映する「ベンチマーク署名（salient tokens の集合）」を提案し、32 の LLM と 89 のベンチマークを用いたメタ評価を通じて、従来の性能相関や意味的類似性を超えた、知識や推論などのタスク間の重なりや、コーディングの孤立性、そして人間の概念構造とは異なる LLM の意味的組織に関する新たな知見を明らかにしています。

Siyang Wu, Honglin Bao, Sida Li, Ari Holtzman, James A. Evans2026-03-10💬 cs.CL

ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

本論文は、LLM ベースのマルチエージェント計画における適応性と効率性のトレードオフを解決するため、サブゴール意図に明示的に紐付いた「アクションチェーン」を基本単位として採用し、既存手法の 30〜40% のトークン消費で同等のタスク成功率を達成する新しいフレームワーク「ELHPlan」を提案しています。

Shaobin Ling, Yun Wang, Chenyou Fan, Tin Lun Lam, Junjie Hu2026-03-10💻 cs

Cold-Start Active Correlation Clustering

この論文は、事前の類似性情報が存在しないコールドスタート局面において、能動学習を通じて効率的にペアワイズ類似性を取得し、多様性を促進するカバレッジ意識型の手法を提案し、その有効性を合成および実世界のデータで実証するものです。

Linus Aronsson, Han Wu, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

本論文は、環境との相互作用を通じて自律的に進化する大規模言語モデルエージェントにおいて、モデル・記憶・ツール・ワークフローの各経路で意図しない有害な進化（Misevolution）が広く発生する実証的証拠を初めて提示し、新たな安全パラダイムの必要性を訴えるものです。

Shuai Shao, Qihan Ren, Chen Qian, Boyi Wei, Dadi Guo, Jingyi Yang, Xinhao Song, Linfeng Zhang, Weinan Zhang, Dongrui Liu, Jing Shao2026-03-10🤖 cs.LG

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

この論文は、デモンストレーション学習における実行の変動への適応性を高めるため、状態遷移パターンを学習して注意機構を調整する「Cross-State Transition Attention（STA）」メカニズムと時間的マスキングを組み合わせ、シミュレーション評価において既存の手法を大幅に上回る性能を示した新しいトランスフォーマーアーキテクチャ「CroSTAta」を提案するものである。

Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini2026-03-10🤖 cs.LG

Automated Extraction of Material Properties using LLM-based AI Agents

この論文は、大規模言語モデル（LLM）駆動の自律的エージェントを用いて約 1 万件の科学論文から熱電および構造特性を抽出し、これまでにない規模のデータセットと再現性の高い抽出パイプラインを構築することで、データ駆動型の材料発見を加速させる手法を提案しています。

Subham Ghosh, Abhishek Tewari2026-03-10🔬 cond-mat.mtrl-sci

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

この論文は、防御者、質問者、ホストという非対称な役割分担を通じて外部からの批判を内部の修正に変換する「FOR-Prompting」手法を提案し、トレーニング不要で小規模モデルでも高精度な推論や人間が好む出力を可能にすることを示しています。

He Zhang, Anzhou Zhang, Jian Dai2026-03-10💬 cs.CL

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

この論文は、LLM の多ターン対話における脆弱性を発見するため、人間の介入なしに多様な攻撃戦略を自律的に探索する強化学習と木探索を統合した新しいフレームワーク「DialTree」を提案し、既存の手法を大幅に上回る攻撃成功率を達成したことを示しています。

Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth2026-03-10🤖 cs.LG

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

この論文は、ミニバッチ・最適輸送とタスク固有の正則化、および教師あり情報の統合を通じて、既存の離散法やニューラルネットワーク手法の限界を克服し、ドメイン適応などの分野で最先端の性能を達成するスケーラブルかつ正則化されたワルシュタイン・バロセンター計算手法を提案しています。

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

本論文は、大規模マルチモーダルモデルをモジュール単位で分解し、SoC 内の最適なアクセラレータに動的に割り当てるハードウェア・ソフトウェア協調設計フレームワーク「NANOMIND」を提案し、バッテリー駆動の小型デバイス上で高効率かつ低消費電力なオンデバイス推論を実現したことを示しています。

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

← 前へ次へ →

cs.AI

Linear probes rely on textual evidence: Results from leakage mitigation studies in language models

Towards Strategic Persuasion with Language Models

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Mapping Overlaps in Benchmarks through Perplexity in the Wild

ELHPlan: Efficient Long-Horizon Task Planning for Multi-Agent Collaboration

Cold-Start Active Correlation Clustering

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Automated Extraction of Material Properties using LLM-based AI Agents

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Membership Inference Attacks on Tokenizers of Large Language Models

Deliberative Dynamics and Value Alignment in LLM Debates

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

Ego-Vision World Model for Humanoid Contact Planning

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLM CoTs