SpecOps: A Fully Automated AI Agent Testing Framework in Real-World GUI Environments

O artigo apresenta o SpecOps, um novo framework de teste totalmente automatizado que utiliza agentes especializados baseados em LLMs para avaliar e identificar falhas em agentes de IA operando em ambientes de interface gráfica do mundo real, demonstrando superioridade em precisão, eficácia na detecção de bugs e viabilidade prática em comparação com abordagens existentes.

Syed Yusuf Ahmed, Shiwei Feng, Chanwoo Bae, Calix Barrus Xiangyu ZhangThu, 12 Ma💻 cs

QuantumX: an experience for the consolidation of Quantum Computing and Quantum Software Engineering as an emerging discipline

Este artigo sintetiza a primeira edição do track QuantumX, realizada no JISBD 2025, que consolidou a comunidade de pesquisa espanhola e ibero-americana ao explorar a interseção entre Computação Quântica e Engenharia de Software, definindo desafios futuros e posicionando a Espanha como um contribuinte emergente no ecossistema global de software quântico.

Juan M. Murillo, Ignacio García Rodríguez de Guzmán, Enrique Moguel, Javier Romero-Álvarez, Jaime Alvarado-Valiente, Álvaro M. Aparicio-Morales, Jose Garcia-Alonso, Ana Díaz Muñoz, Eduardo Fernández-Medina, Francisco Chicano, Carlos Canal, José Daniel Viqueira, Sebastián Villarroya, Eduardo Gutiérrez, Adrián Romero-Flores, Alfonso E. Márquez-Chamorro, Antonio Ruiz-Cortes, Cyrille YetuYetu Kesiku, Pedro Sánchez, Diego Alonso Cáceres, Lidia Sánchez-González, Fernando PlouThu, 12 Ma💻 cs

Nurture-First Agent Development: Building Domain-Expert AI Agents Through Conversational Knowledge Crystallization

O artigo propõe o Desenvolvimento Primeiro do Cuidado (NFD), um novo paradigma que substitui as abordagens tradicionais de codificação ou prompts estáticos pelo crescimento progressivo de agentes de IA especializados através de interações conversacionais estruturadas com praticantes do domínio, utilizando um Ciclo de Cristalização do Conhecimento para transformar o conhecimento tácito e fragmentado em ativos reutilizáveis.

Linghao ZhangThu, 12 Ma🤖 cs.AI

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

Este estudo investigou como traços de humor, circunstâncias de vida e dinâmicas de grupo influenciam a percepção de sentimentos em mensagens de desenvolvimento de software por estudantes, revelando que essa percepção é moderadamente estável, altamente dependente do conteúdo da mensagem e pouco afetada por fases do projeto, o que sugere cautela ao interpretar análises de sentimento automatizadas.

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt SchneiderThu, 12 Ma💻 cs

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Este artigo investiga como a Inteligência Artificial atua como catalisador para a inovação na Engenharia de Software, demonstrando através de revisão bibliográfica e estudo empírico que a integração de ferramentas de ML e NLP otimiza práticas ágeis ao automatizar tarefas repetitivas e melhorar a gestão de requisitos, geração de código e testes.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-CisnerosThu, 12 Ma🤖 cs.AI

Software Development Life Cycle Perspective: A Survey of Benchmarks for Code Large Language Models and Agents

Este artigo apresenta uma análise sistemática de 178 benchmarks para modelos de linguagem e agentes de código, revelando um desequilíbrio significativo que prioriza excessivamente a fase de implementação em detrimento do planejamento e design, além de apontar a falta de estratégias contra contaminação de dados e propor direções futuras para alinhar as capacidades teóricas dessas ferramentas com sua eficácia prática no ciclo de vida de desenvolvimento de software.

Kaixin Wang, Tianlin Li, Xiaoyu Zhang, Chong Wang, Weisong Sun, Yang Liu, Aishan Liu, Xianglong Liu, Chao Shen, Bin ShiMon, 09 Ma🤖 cs.AI

ROS-related Robotic Systems Development with V-model-based Application of MeROS Metamodel

Este artigo propõe uma metodologia estruturada baseada no metamodelo MeROS e adaptada ao modelo em V para integrar a Engenharia de Sistemas Baseada em Modelos (MBSE) com o Robot Operating System (ROS), visando garantir coerência semântica e rastreabilidade no desenvolvimento de sistemas robóticos heterogêneos complexos.

Tomasz Winiarski, Jan Kaniuka, Daniel Giełdowski, Jakub Ostrysz, Krystian Radlak, Dmytro KushnirMon, 09 Ma💻 cs

A Structured Approach to Safety Case Construction for AI Systems

Este artigo propõe uma abordagem estruturada e reutilizável para a construção de casos de segurança em sistemas de IA, introduzindo taxonomias específicas e modelos adaptados para lidar com as dinâmicas imprevisíveis e evolutivas da IA generativa e agêntica, superando as limitações dos métodos tradicionais de engenharia.

Sung Une Lee, Liming Zhu, Md Shamsujjoha, Liming Dong, Qinghua Lu, Jieshan Chen, Lionel BriandMon, 09 Ma💻 cs

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

O artigo apresenta o SWE-MiniSandbox, uma abordagem leve e sem containers que utiliza mecanismos isolados no nível do kernel e técnicas de pré-armazenamento para reduzir drasticamente a sobrecarga de disco e o tempo de configuração no treinamento de agentes de engenharia de software por aprendizado por reforço, mantendo desempenho comparável ao dos pipelines baseados em containers.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan ZhaoMon, 09 Ma🤖 cs.AI

The Limits of Long-Context Reasoning in Automated Bug Fixing

Este estudo demonstra que, apesar do desempenho promissor de modelos de linguagem em fluxos de trabalho agênicos para correção de bugs, a capacidade de raciocínio em contextos longos é limitada, pois o sucesso depende da decomposição de tarefas em etapas de contexto curto, enquanto a geração de patches em contextos genuinamente longos (64k tokens) resulta em degradação severa de desempenho devido a falhas sistemáticas.

Ravi Raju, Mengmeng Ji, Shubhangi Upasani, Bo Li, Urmish ThakkerMon, 09 Ma🤖 cs.LG