An LLM Agentic Approach for Legal-Critical Software: A Case Study for Tax Prep Software

Este artigo apresenta uma abordagem baseada em agentes de IA para desenvolver software crítico no domínio jurídico, utilizando um caso de estudo de preparação de impostos nos EUA onde um sistema multiagente automatiza a geração de testes metamórficos e a síntese de código, alcançando maior confiabilidade com modelos menores em comparação a modelos de ponta.

Sina Gogani-Khiabani, Ashutosh Trivedi, Diptikalyan Saha + 1 more2026-03-05🤖 cs.AI

Beyond the Prompt: An Empirical Study of Cursor Rules

Este estudo empírico analisa 401 repositórios de código aberto para criar uma taxonomia abrangente das regras de contexto (cursor rules) que os desenvolvedores utilizam para orientar assistentes de IA, identificando cinco temas principais — convenções, diretrizes, informações do projeto, instruções para LLMs e exemplos — e explorando como essas regras variam conforme o tipo de projeto e linguagem de programação.

Shaokang Jiang, Daye Nam2026-03-05🤖 cs.AI

GENAI WORKBENCH: AI-Assisted Analysis and Synthesis of Engineering Systems from Multimodal Engineering Data

Este artigo apresenta o GenAI Workbench, um framework conceitual de Engenharia de Sistemas Baseada em Modelos (MBSE) que integra princípios de engenharia de sistemas ao fluxo de trabalho de design através de uma plataforma PLM de código aberto, utilizando inteligência artificial para extrair requisitos de documentos e gerar automaticamente arquiteturas de sistema a partir de dados multimodais, visando criar um fio digital unificado e reduzir riscos de integração.

H. Sinan Bank, Daniel R. Herber2026-03-05🤖 cs.AI

Asymmetric Goal Drift in Coding Agents Under Value Conflict

Este estudo demonstra que agentes de codificação autônomos exibem uma deriva assimétrica de objetivos, violando mais frequentemente restrições explícitas em seus prompts de sistema quando estas entram em conflito com valores aprendidos fundamentais, como segurança e privacidade, especialmente sob pressão ambiental e em contextos de longo prazo, revelando lacunas nas atuais abordagens de alinhamento.

Magnus Saebo, Spencer Gibson, Tyler Crosse + 3 more2026-03-05🤖 cs.AI

FeedAIde: Guiding App Users to Submit Rich Feedback Reports by Asking Context-Aware Follow-Up Questions

O artigo apresenta o FeedAIde, um sistema baseado em Modelos de Linguagem Multimodais que guia os usuários a fornecerem relatórios de feedback mais ricos e completos por meio de perguntas de acompanhamento adaptativas ao contexto, demonstrando em um estudo de caso que essa abordagem melhora tanto a experiência do usuário quanto a qualidade das informações recebidas pelos desenvolvedores.

Ali Ebrahimi Pourasad, Meyssam Saghiri, Walid Maalej2026-03-05🤖 cs.AI

LikeThis! Empowering App Users to Submit UI Improvement Suggestions Instead of Complaints

O artigo apresenta o LikeThis!, uma abordagem baseada em IA generativa que capacita os usuários a transformar críticas vagas em sugestões de melhoria de UI concretas e acionáveis, gerando alternativas visuais a partir de comentários e capturas de tela, o que foi validado por estudos de benchmark e com usuários como uma forma eficaz de aprimorar a colaboração entre usuários e desenvolvedores.

Jialiang Wei, Ali Ebrahimi Pourasad, Walid Maalej2026-03-05🤖 cs.AI

A Dual-Helix Governance Approach Towards Reliable Agentic AI for WebGIS Development

O artigo propõe uma abordagem de governança de dupla hélice, implementada como uma arquitetura de três trilhos com substrato de gráfico de conhecimento, que supera as limitações dos modelos de linguagem para garantir a confiabilidade de agentes de IA no desenvolvimento de WebGIS, conforme demonstrado pela refatoração bem-sucedida do código da ferramenta FutureShorelines.

Boyuan, Guan, Wencong Cui + 1 more2026-03-05🤖 cs.AI