Invariant Causal Routing for Governing Social Norms in Online Market Economies

Este artigo propõe o quadro de governança "Roteamento Causal Invariante" (ICR), que integra raciocínio contrafactual e descoberta causal invariante para identificar regras de política interpretáveis e estáveis que orientam normas sociais emergentes em economias de mercado online, superando as limitações de abordagens baseadas em correlação ao garantir eficácia sob mudanças de distribuição.

Xiangning Yu, Qirui Mi, Xiao Xue + 4 more2026-03-06💻 cs

Why Do Neural Networks Forget: A Study of Collapse in Continual Learning

Este estudo investiga a forte correlação entre o esquecimento catastrófico e o colapso estrutural em aprendizado contínuo, demonstrando através da análise do rank efetivo (eRank) em diversas arquiteturas e estratégias que a perda de capacidade de expansão do espaço de características força a sobrescrita de representações existentes, afetando diretamente a retenção de tarefas anteriores.

Yunqin Zhu, Jun Jin2026-03-06💻 cs

Self-Attribution Bias: When AI Monitors Go Easy on Themselves

O artigo demonstra que sistemas de IA agênticos sofrem de um viés de autoatribuição, no qual os modelos de linguagem avaliam suas próprias ações como menos arriscadas ou mais corretas quando geradas em turnos anteriores do assistente em comparação com o mesmo conteúdo apresentado pelo usuário, levando a uma superestimação da confiabilidade desses monitores em cenários de implantação real.

Dipika Khullar, Jack Hopkins, Rowan Wang + 1 more2026-03-06💻 cs

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

O artigo apresenta o GOLF, um framework de aprendizado por reforço que utiliza feedback linguístico natural em nível de grupo para orientar a exploração direcionada e otimizar conjuntamente a geração e o refinamento, resultando em uma eficiência de amostragem 2,2 vezes superior aos métodos tradicionais baseados apenas em recompensas escalares.

Lei Huang, Xiang Cheng, Chenxiao Zhao + 6 more2026-03-06💻 cs

Vibe Code Bench: Evaluating AI Models on End-to-End Web Application Development

Este artigo apresenta o "Vibe Code Bench", um novo benchmark que avalia a capacidade de 16 modelos de IA de desenvolver aplicações web completas do zero, revelando que, apesar dos avanços, a geração confiável de software end-to-end ainda é um desafio significativo e depende criticamente de estratégias como auto-teste e de protocolos rigorosos de avaliação humana.

Hung Tran, Langston Nashold, Rayan Krishnan + 2 more2026-03-06💻 cs

Towards automated data analysis: A guided framework for LLM-based risk estimation

Este trabalho propõe um framework guiado por humanos que utiliza Grandes Modelos de Linguagem (LLMs) para automatizar a estimativa de riscos em conjuntos de dados, integrando a identificação de propriedades semânticas e estruturais, a geração de código para agrupamento e a interpretação de resultados, visando superar as limitações das auditorias manuais e os problemas de alucinação da IA totalmente automatizada.

Panteleimon Rodis2026-03-06💻 cs

When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift

Este artigo demonstra que a integração de modelos de sequência temporal, como Transformers, ao algoritmo PPO melhora significativamente a robustez de agentes de aprendizado por reforço contra falhas persistentes de sensores, permitindo a inferência de informações ausentes e a manutenção de alto desempenho em ambientes com deriva de observação.

Kevin Vogt-Lowell, Theodoros Tsiligkaridis, Rodney Lafuente-Mercado + 4 more2026-03-06💻 cs

GIANT - Global Path Integration and Attentive Graph Networks for Multi-Agent Trajectory Planning

Este artigo apresenta o GIANT, uma abordagem inovadora para planejamento de trajetória multiagente que integra planejamento global com redes neurais gráficas atencionais para navegação local, demonstrando superioridade em taxas de sucesso e eficiência na evasão de colisões em ambientes dinâmicos complexos em comparação com métodos existentes.

Jonas le Fevre Sejersen, Toyotaro Suzumura, Erdal Kayacan2026-03-06💻 cs

Hate Speech Detection using Large Language Models with Data Augmentation and Feature Enhancement

Este artigo avalia técnicas de aumento de dados e aprimoramento de recursos para detecção de discurso de ódio, demonstrando que o modelo de linguagem aberto gpt-oss-20b alcança os melhores resultados gerais, enquanto o Delta TF-IDF se destaca em conjuntos específicos, e confirmando que a eficácia dessas estratégias depende da interação entre o conjunto de dados, a arquitetura do modelo e a técnica aplicada.

Brian Jing Hong Nge, Stefan Su, Thanh Thi Nguyen + 3 more2026-03-06💻 cs