Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads

O artigo apresenta o Lockbox, uma arquitetura de Confiança Zero projetada para garantir o processamento seguro de cargas de trabalho sensíveis na nuvem, aplicando verificação explícita de confiança, isolamento forte e acesso de menor privilégio para permitir o uso de ferramentas avançadas, como IA, sem comprometer a segurança.

Vamshi Krishna Thotempudi, Mahima Agarwal, Raghav Batta, Anjali MangalWed, 11 Ma💻 cs

Class Model Generation from Requirements using Large Language Models

Este artigo investiga a capacidade de modelos de linguagem avançados (como GPT-5 e Claude Sonnet 4.0) de gerar automaticamente diagramas de classes UML a partir de requisitos em linguagem natural, propondo um framework de validação dual que combina julgamento por IA e avaliação humana para demonstrar que tais modelos produzem diagramas estruturalmente coerentes e semanticamente significativos com alta alinhamento às avaliações de especialistas.

Jackson Nguyen, Rui En Koe, Fanyu Wang, Chetan Arora, Alessio FerrariWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

O artigo apresenta o ToolRosetta, um quadro unificado que automatiza a tradução de repositórios de código de código aberto em ferramentas compatíveis com o Protocolo de Contexto de Modelo (MCP), permitindo que agentes de modelos de linguagem de grande escala executem tarefas complexas com intervenção humana mínima e garantias de segurança.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

Este artigo relata a experiência no desenvolvimento de três currículos de engenharia de software para profissionais e descreve uma abordagem sistemática baseada no mapeamento de conteúdo para integrar cursos de engenharia de requisitos, propondo princípios fundamentais para essa adaptação.

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide FucciWed, 11 Ma💻 cs

Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum

Este artigo apresenta um currículo de engenharia de IA baseado em projetos que integra práticas ágeis e ferramentas de IA para preparar estudantes de engenharia de software, demonstrando por meio de um estudo de caso que essa abordagem integrada desenvolve competências práticas, embora exija adaptações no ensino e verificação oral para garantir a aprendizagem fundamental.

Andreas Rausch, Stefan Wittek, Tobias Geger, David InkermannWed, 11 Ma💻 cs

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

O artigo apresenta o EsoLang-Bench, um novo benchmark que utiliza linguagens de programação esotéricas para avaliar o raciocínio genuíno de modelos de linguagem, revelando que, apesar de seu alto desempenho em tarefas de codificação convencionais, eles falham drasticamente ao aprender novas linguagens a partir de documentação, indicando que seus resultados anteriores derivam mais de memorização do que de capacidade de raciocínio transferível.

Aman Sharma, Paras ChopraWed, 11 Ma🤖 cs.AI

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Este artigo explora o potencial transformador da inteligência artificial na geração e validação de casos de teste, destacando como essa tecnologia supera os desafios dos métodos tradicionais ao aumentar a eficiência, a cobertura e a confiabilidade dos lançamentos de software, ao mesmo tempo em que aborda os obstáculos relacionados à qualidade dos dados e à supervisão humana.

Mohammad Baqar, Rajat KhandaTue, 10 Ma💻 cs

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Este artigo analisa a segurança e a qualidade do código gerado por modelos de linguagem de grande escala (LLMs) em múltiplas linguagens, revelando que, embora a automação seja eficaz, os modelos frequentemente falham ao adotar recursos de segurança modernos e ainda empregam métodos desatualizados, especialmente em C++ e Java 17.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David MohaisenTue, 10 Ma🤖 cs.LG

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

O artigo apresenta o iProg, uma ferramenta de Programação Indutiva Estruturada Interativa que utiliza um protocolo de comunicação bidirecional para colaborar com especialistas humanos e modelos de linguagem na decomposição de tarefas de análise de dados em diagramas de fluxo e geração de código, demonstrando superioridade em desempenho, qualidade e velocidade de desenvolvimento em comparação com alternativas Low Code/No Code em colaborações científicas.

Shraddha Surana, Ashwin Srinivasan, Michael BainTue, 10 Ma💻 cs