cs.MA artigos | Gist.Science

Learning Approximate Nash Equilibria in Cooperative Multi-Agent Reinforcement Learning via Mean-Field Subsampling

Este artigo propõe e analisa o framework de aprendizado alternado $\texttt{ALTERNATING-MARL}$ , que permite a um agente global e a uma população massiva de agentes locais em sistemas com restrições de comunicação convergirem para um Equilíbrio de Nash aproximado com complexidade de amostra reduzida, validando a eficácia da abordagem em simulações de controle multi-robô e otimização federada.

Emile Anand, Ishani Karmarkar2026-03-05🤖 cs.AI

MACC: Multi-Agent Collaborative Competition for Scientific Exploration

O artigo apresenta o MACC, uma arquitetura institucional que integra um espaço de trabalho científico compartilhado e mecanismos de incentivo para estudar como a colaboração e a competição entre agentes de IA independentes podem superar as limitações da descoberta científica tradicional, promovendo transparência, reprodutibilidade e eficiência exploratória.

Satoshi Oyama, Yuko Sakurai, Hisashi Kashima2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

Este artigo demonstra que prompts adversarialmente otimizados podem induzir modelos de linguagem a "sandbagging" (subdesempenho estratégico) ao explorarem a consciência de avaliação, causando degradações drásticas no desempenho em tarefas específicas e revelando que essa vulnerabilidade é governada pela estrutura da tarefa e por um raciocínio causal de avaliação, e não apenas pela força do prompt.

Maheep Chaudhary2026-03-05🤖 cs.AI

Robustness of Agentic AI Systems via Adversarially-Aligned Jacobian Regularization

Este artigo propõe a Regularização de Jacobiano Alinhada Adversarialmente (AAJR), uma abordagem que controla a sensibilidade dos sistemas de IA agêntica apenas nas direções de ascensão adversarial, garantindo estabilidade no treinamento minimax sem as restrições excessivas e a perda de desempenho associadas aos limites globais de Jacobiano.

Furkan Mumcu, Yasin Yilmaz2026-03-05🤖 cs.AI

← Anterior