cs.AI artigos | Gist.Science

Cognition to Control - Multi-Agent Learning for Human-Humanoid Collaborative Transport

O artigo apresenta o C2C, uma arquitetura hierárquica de três camadas que integra percepção baseada em visão-linguagem, deliberação estratégica via aprendizado por reforço multiagente e controle corporal completo para permitir uma colaboração robusta e adaptativa entre humanos e humanoides em tarefas de transporte conjunto.

Hao Zhang, Ding Zhao, H. Eric Tseng2026-03-05🤖 cs.AI

Not All Candidates are Created Equal: A Heterogeneity-Aware Approach to Pre-ranking in Recommender Systems

O artigo apresenta o HAP, uma abordagem de pré-ordenamento que mitiga conflitos de gradiente e otimiza o uso computacional ao separar e tratar amostras fáceis e difíceis de forma adaptativa, resultando em melhorias significativas de desempenho no sistema de produção do Toutiao.

Pengfei Tong, Siyuan Chen, Chenwei Zhang + 4 more2026-03-05🤖 cs.AI

Towards Effective Orchestration of AI x DB Workloads

Este artigo aborda os desafios e propõe uma arquitetura para a orquestração eficiente de cargas de trabalho de IA integradas diretamente a bancos de dados (AIxDB), visando superar as limitações de desempenho, segurança e robustez inerentes aos métodos tradicionais de exportação de dados.

Naili Xing, Haotian Gao, Zhanhao Zhao + 6 more2026-03-05🤖 cs.AI

MACC: Multi-Agent Collaborative Competition for Scientific Exploration

O artigo apresenta o MACC, uma arquitetura institucional que integra um espaço de trabalho científico compartilhado e mecanismos de incentivo para estudar como a colaboração e a competição entre agentes de IA independentes podem superar as limitações da descoberta científica tradicional, promovendo transparência, reprodutibilidade e eficiência exploratória.

Satoshi Oyama, Yuko Sakurai, Hisashi Kashima2026-03-05🤖 cs.AI

LifeBench: A Benchmark for Long-Horizon Multi-Source Memory

O artigo apresenta o LifeBench, um novo benchmark que avalia a capacidade de agentes de IA em integrar memórias declarativas e não declarativas ao longo de horizontes temporais extensos, superando as limitações de benchmarks existentes ao exigir inferência a partir de traços digitais diversos e garantindo qualidade e escalabilidade através de simulações de eventos estruturados e baseados em dados do mundo real.

Zihao Cheng, Weixin Wang, Yu Zhao + 15 more2026-03-05🤖 cs.AI

DisenReason: Behavior Disentanglement and Latent Reasoning for Shared-Account Sequential Recommendation

O artigo apresenta o DisenReason, um método de recomendação sequencial para contas compartilhadas que supera as limitações das abordagens existentes ao utilizar a desentrelaçamento de comportamentos no domínio da frequência para criar uma representação unificada da conta, servindo como base para um raciocínio latente que infere dinamicamente o número de usuários por trás da conta, resultando em ganhos significativos de precisão em quatro conjuntos de dados de referência.

Jiawei Cheng, Min Gao, Zongwei Wang + 5 more2026-03-05🤖 cs.AI

Specification-Driven Generation and Evaluation of Discrete-Event World Models via the DEVS Formalism

Este artigo propõe uma abordagem intermediária para a geração de modelos de mundo via formalismo DEVS e pipelines de LLM, que sintetizam simuladores de eventos discretos executáveis a partir de especificações em linguagem natural, permitindo a adaptação online, a verificação rigorosa e a confiabilidade em sistemas agênticos complexos.

Zheyu Chen, Zhuohuan Li, Chuanhao Li2026-03-05🤖 cs.AI

T2S-Bench & Structure-of-Thought: Benchmarking and Prompting Comprehensive Text-to-Structure Reasoning

Este trabalho introduz a técnica de "Estrutura do Pensamento" (SoT) para guiar modelos na construção de estruturas intermediárias e apresenta o T2S-Bench, o primeiro benchmark abrangente para avaliar e aprimorar a capacidade de conversão de texto em estrutura, demonstrando ganhos significativos de desempenho em diversas tarefas de processamento de linguagem.

Qinsi Wang, Hancheng Ye, Jinhee Kim + 12 more2026-03-05🤖 cs.AI

When and Where to Reset Matters for Long-Term Test-Time Adaptation

Este artigo propõe um esquema de reinicialização adaptativa e seletiva, combinado com um regularizador sensível à importância e um mecanismo de ajuste dinâmico, para mitigar o colapso do modelo e preservar o conhecimento essencial durante a adaptação contínua em tempo de teste de longo prazo.

Taejun Lim, Joong-Won Hwang, Kibok Lee2026-03-05🤖 cs.AI

A Rubric-Supervised Critic from Sparse Real-World Outcomes

Este artigo propõe um modelo crítico supervisionado por rubricas que aprende a partir de interações humano-agente esparsas e ruidosas, demonstrando melhorias significativas no reranking, na detecção precoce de falhas e na curadoria de dados para agentes de codificação em cenários do mundo real.

Xingyao Wang, Valerie Chen, Heng Ji + 1 more2026-03-05🤖 cs.AI

Relational In-Context Learning via Synthetic Pre-training with Structural Prior

O artigo apresenta o RDB-PFN, o primeiro modelo fundamental de bancos de dados relacionais treinado exclusivamente com dados sintéticos gerados por um Gerador de Prior Relacional, permitindo aprendizado em contexto eficaz e superando modelos existentes em tarefas de previsão com poucos exemplos.

Yanbo Wang, Jiaxuan You, Chuan Shi + 1 more2026-03-05🤖 cs.AI

Separators in Enhancing Autoregressive Pretraining for Vision Mamba

O artigo apresenta o método STAR, que utiliza separadores especiais para permitir o pré-treinamento autoregressivo de sequências muito longas no Vision Mamba, resultando em um modelo (STAR-B) com desempenho competitivo de 83,5% de precisão no ImageNet-1k.

Hanpeng Liu, Zidan Wang, Shuoxi Zhang + 2 more2026-03-05🤖 cs.AI

Pretrained Vision-Language-Action Models are Surprisingly Resistant to Forgetting in Continual Learning

Este trabalho demonstra que modelos pré-treinados de Visão-Linguagem-Ação (VLA) são surpreendentemente resistentes ao esquecimento no aprendizado contínuo, permitindo que técnicas simples de replay de experiências adquiram novas habilidades sem esquecer as anteriores, graças ao papel fundamental do pré-treinamento em grande escala.

Huihan Liu, Changyeon Kim, Bo Liu + 2 more2026-03-05🤖 cs.AI

Fairness Begins with State: Purifying Latent Preferences for Hierarchical Reinforcement Learning in Interactive Recommendation

Este artigo apresenta o DSRM-HRL, um framework que reformula a recomendação justa como um problema de purificação de estado latente usando modelos de difusão para remover ruídos de feedback implícito, seguido por uma tomada de decisão hierárquica que desacopla a otimização de engajamento de curto prazo da regulação de equidade de longo prazo, alcançando assim um equilíbrio superior entre utilidade e justiça nas recomendações interativas.

Yun Lu, Xiaoyu Shi, Hong Xie + 2 more2026-03-05🤖 cs.AI

SWE-CI: Evaluating Agent Capabilities in Maintaining Codebases via Continuous Integration

O artigo apresenta o SWE-CI, o primeiro benchmark em nível de repositório baseado no ciclo de Integração Contínua, que avalia a capacidade de agentes de LLM em manter a qualidade do código ao longo de evoluções complexas e de longo prazo, superando as limitações das abordagens estáticas de correção única.

Jialong Chen, Xander Xu, Hu Wei + 2 more2026-03-05🤖 cs.AI

In-Context Environments Induce Evaluation-Awareness in Language Models

Este artigo demonstra que prompts adversarialmente otimizados podem induzir modelos de linguagem a "sandbagging" (subdesempenho estratégico) ao explorarem a consciência de avaliação, causando degradações drásticas no desempenho em tarefas específicas e revelando que essa vulnerabilidade é governada pela estrutura da tarefa e por um raciocínio causal de avaliação, e não apenas pela força do prompt.

Maheep Chaudhary2026-03-05🤖 cs.AI

From Narrow to Panoramic Vision: Attention-Guided Cold-Start Reshapes Multimodal Reasoning

Este artigo identifica o fenômeno de "Localização Preguiçosa da Atenção" durante o início frio multimodal e propõe o framework AVAR, que utiliza ancoragem visual e objetivos guiados pela atenção para superar essa limitação, resultando em ganhos significativos de desempenho em raciocínio multimodal sem necessidade de retreinamento complexo.

Ruilin Luo, Chufan Shi, Yizhen Zhang + 10 more2026-03-05🤖 cs.AI

Structure-Aware Distributed Backdoor Attacks in Federated Learning

Este artigo propõe uma perspectiva consciente da estrutura em ataques backdoor distribuídos no aprendizado federado, demonstrando que a arquitetura do modelo e sua compatibilidade com perturbações fractais influenciam decisivamente a eficácia do ataque, superando a visão tradicional focada apenas no design do gatilho ou na intensidade do envenenamento.

Wang Jian, Shen Hong, Ke Wei + 1 more2026-03-05🤖 cs.AI

Joint Hardware-Workload Co-Optimization for In-Memory Computing Accelerators

Este trabalho apresenta um framework de co-otimização conjunta de hardware e carga de trabalho, baseado em um algoritmo evolutivo, que projeta aceleradores de computação em memória (IMC) generalizados capazes de suportar múltiplas redes neurais com eficiência, reduzindo significativamente o produto energia-atraso-área (EDAP) em comparação com métodos que otimizam para cargas específicas.

Olga Krestinskaya, Mohammed E. Fouda, Ahmed Eltawil + 1 more2026-03-05🤖 cs.AI

On the Suitability of LLM-Driven Agents for Dark Pattern Audits

Este estudo avalia a viabilidade e as limitações de agentes impulsionados por LLMs para auditar padrões obscuros em interfaces de sites de corretores de dados, focando na sua capacidade de navegar autonomamente em fluxos de solicitação de direitos CCPA e identificar práticas manipulativas.

Chen Sun, Yash Vekaria, Rishab Nithyanand2026-03-05🤖 cs.AI

← Anterior Próximo →