cs.SE articles | Gist.Science

Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads

Ce papier présente Lockbox, une architecture Zero Trust conçue pour permettre le traitement sécurisé de charges de travail cloud sensibles en appliquant une vérification explicite, une isolation stricte et un contrôle d'accès minimaliste tout au long du cycle de vie de l'application.

Vamshi Krishna Thotempudi, Mahima Agarwal, Raghav Batta, Anjali MangalWed, 11 Ma💻 cs

Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software

Cet article présente une pipeline automatisée utilisant des modèles de langage (LLM) pour détecter et analyser les causes racines des tests flous dans les logiciels quantiques, ayant permis d'identifier 25 nouveaux cas et d'atteindre une précision élevée avec le modèle Google Gemini.

Janakan Sivaloganathan, Ainaz Jamshidi, Andriy Miranskyy, Lei ZhangWed, 11 Ma🤖 cs.AI

The Future of Software Engineering Conferences: A New Zealand Perspective

Cet article examine les obstacles géographiques et financiers auxquels sont confrontés les chercheurs néo-zélandais dans les conférences d'ingénierie logicielle et propose des stratégies, telles que l'adoption de formats hybrides et des réformes de gouvernance, pour favoriser une participation mondiale plus équitable.

Kelly Blincoe, Sherlock A. Licorish, Judith Fuchs, Amjed TahirWed, 11 Ma💻 cs

Synergistic Directed Execution and LLM-Driven Analysis for Zero-Day AI-Generated Malware Detection

Cet article présente un cadre d'analyse hybride novateur combinant l'exécution concolique guidée par des LLM et une classification par apprentissage profond pour détecter avec des garanties formelles les malwares générés par IA, surpassant les méthodes traditionnelles avec une précision de 97,5 % sur des menaces zero-day.

George Edwards, Mahdi EslamimehrWed, 11 Ma💻 cs

Class Model Generation from Requirements using Large Language Models

Cette étude évalue la capacité de modèles de langage avancés à générer automatiquement des diagrammes de classes UML à partir d'exigences textuelles en proposant un cadre de validation hybride qui démontre leur alignement significatif avec les évaluations humaines.

Jackson Nguyen, Rui En Koe, Fanyu Wang, Chetan Arora, Alessio FerrariWed, 11 Ma💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Le papier présente AgenticCyOps, un cadre de sécurité architectural qui définit des principes de défense pour sécuriser l'intégration des systèmes multi-agents dans les opérations cybernétiques d'entreprise en réduisant les surfaces d'attaque et en s'alignant sur les normes de conformité.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Le papier présente ToolRosetta, un cadre unifié qui automatise la conversion de dépôts de code open-source en outils MCP standardisés pour permettre aux agents d'IA d'exécuter des tâches complexes avec une intervention humaine minimale, tout en intégrant une couche de sécurité et en surpassant les performances des modèles commerciaux.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

Cette étude de cas démontre que, bien que ChatGPT puisse générer des spécifications de exigences système synthétiques réalistes dans une certaine mesure grâce à des itérations de prompts, les évaluations automatisées par LLM ne peuvent pas remplacer les vérifications approfondies par des experts en raison de contradictions et de lacunes détectées.

Alex R. Mattukat, Florian M. Braun, Horst LichterWed, 11 Ma💻 cs

Declarative Scenario-based Testing with RoadLogic

Le papier présente RoadLogic, une solution open-source qui comble le fossé entre les spécifications déclaratives OpenSCENARIO et les simulations exécutables pour les véhicules autonomes en utilisant la programmation par ensembles de réponses et la planification de mouvement pour générer automatiquement des scénarios réalistes et conformes.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

Ce rapport d'expérience présente une approche systématique et des principes fondamentaux pour intégrer efficacement des cours d'ingénierie des exigences dans des curriculums d'ingénierie logicielle destinés aux professionnels, en tenant compte de la nature dynamique et modulaire de ces formations.

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide FucciWed, 11 Ma💻 cs

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Cet article présente la synthèse et sollicite des retours sur le modèle d'artefacts pour l'ingénierie des exigences réglementaires (AM4RRE), conçu pour faciliter une intégration systématique de la conformité dès la conception dans le cycle de développement logiciel en surmontant les défis de coordination entre les différentes perspectives.

Oleksandr KosenkovWed, 11 Ma💻 cs

EmbC-Test: How to Speed Up Embedded Software Testing Using LLMs and RAG

Cet article présente EmbC-Test, une solution basée sur le RAG et les LLMs qui automatise la génération de tests pour le logiciel embarqué en C, permettant de réduire le temps de test de 66 % tout en assurant un taux de validation d'exécution de 85 %.

Maximilian Harnot, Sebastian Komarnicki, Michal Polok, Timo OksanenWed, 11 Ma💻 cs

Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum

Cet article présente un curriculum d'ingénierie IA basé sur des projets qui intègre les pratiques agiles et les outils d'IA générative pour préparer les étudiants au développement logiciel moderne, en s'appuyant sur une étude de cas et des évaluations préliminaires.

Andreas Rausch, Stefan Wittek, Tobias Geger, David InkermannWed, 11 Ma💻 cs

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Le papier présente EsoLang-Bench, un nouveau benchmark utilisant des langages de programmation ésotériques pour révéler que les grands modèles de langage, bien que performants sur les tâches de codage standards, échouent à démontrer un raisonnement véritable en raison d'une dépendance excessive à la mémorisation des données d'entraînement.

Aman Sharma, Paras ChopraWed, 11 Ma🤖 cs.AI

An Empirical Study of Interaction Smells in Multi-Turn Human-LLM Collaborative Code Generation

Cette étude empirique propose une première taxonomie des « Interaction Smells » dans la génération de code collaborative multi-tours avec les LLM, analyse leur distribution sur plusieurs modèles et introduit le cadre InCE pour améliorer la qualité des interactions grâce à l'extraction d'invariants globaux et à des audits pré-génération.

Binquan Zhang, Li Zhang, Lin Shi, Song Wang, Yuwei Qian, Linhui Zhao, Fang Liu, An Fu, Yida YeWed, 11 Ma💻 cs

Towards a Neural Debugger for Python

Cet article présente les « neural debuggers », des modèles de langage capables d'émuler les fonctionnalités interactives des débogueurs traditionnels pour prédire l'exécution de programmes Python, ouvrant ainsi la voie à des systèmes de codage autonomes plus performants.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel SynnaeveWed, 11 Ma🤖 cs.AI

MORCoRA: Multi-Objective Refactoring Recommendation Considering Review Availability

L'article présente MORCoRA, une technique de recherche multi-objectif qui recommande des séquences de refactorisation améliorant la qualité du code tout en identifiant des réviseurs experts et disponibles pour garantir une revue rapide et efficace.

Lei Chen, Shinpei HayashiTue, 10 Ma💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Cet article examine comment l'intelligence artificielle transforme le génie logiciel en automatisant la génération et la validation des cas de test pour améliorer l'efficacité, la précision et l'évolutivité, tout en abordant les défis liés à la qualité des données et à la nécessité d'une supervision humaine.

Mohammad Baqar, Rajat KhandaTue, 10 Ma💻 cs

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Cette étude analyse la sécurité et la qualité du code généré par des modèles de langage (LLM) sur plusieurs langages, révélant que leur efficacité varie considérablement et qu'ils ont souvent tendance à utiliser des méthodes obsolètes plutôt que les fonctionnalités de sécurité modernes.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David MohaisenTue, 10 Ma🤖 cs.LG

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

Cet article présente iProg, un outil d'induction inductive interactive structurée qui utilise un protocole de communication à double intelligibilité pour collaborer avec des LLMs et des experts humains afin de générer rapidement des systèmes d'analyse de données fiables et interprétables, surpassant les approches Low Code/No Code traditionnelles.

Shraddha Surana, Ashwin Srinivasan, Michael BainTue, 10 Ma💻 cs

← Précédent Suivant →