cs.SE Arbeiten | Gist.Science

Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads

Das Paper stellt Lockbox vor, eine Zero-Trust-Architektur, die durch explizite Vertrauensprüfung, starke Isolation und policy-gesteuerte Durchsetzung die sichere Verarbeitung sensibler Cloud-Workloads unter strengen Sicherheitsanforderungen ermöglicht.

Vamshi Krishna Thotempudi, Mahima Agarwal, Raghav Batta, Anjali MangalWed, 11 Ma💻 cs

Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software

Diese Arbeit stellt eine automatisierte Pipeline vor, die mithilfe von Large Language Models (LLMs) flaky Tests in Quantensoftware erkennt und deren Ursachen analysiert, wodurch ein bestehender Datensatz um 54 % erweitert wird und Modelle wie Google Gemini eine hohe Genauigkeit bei der Klassifizierung und Ursachenidentifikation erreichen.

Janakan Sivaloganathan, Ainaz Jamshidi, Andriy Miranskyy, Lei ZhangWed, 11 Ma🤖 cs.AI

The Future of Software Engineering Conferences: A New Zealand Perspective

Dieser Artikel beleuchtet aus neuseeländischer Perspektive die Hindernisse für die Teilnahme an Software-Engineering-Konferenzen und schlägt Strategien wie hybride Formate und Governance-Reformen vor, um eine gerechtere globale Beteiligung zu fördern.

Kelly Blincoe, Sherlock A. Licorish, Judith Fuchs, Amjed TahirWed, 11 Ma💻 cs

Synergistic Directed Execution and LLM-Driven Analysis for Zero-Day AI-Generated Malware Detection

Diese Arbeit stellt einen hybriden Analyse-Rahmen vor, der konkolische Ausführung, LLM-gesteuerte Pfadpriorisierung und Deep Learning kombiniert, um Zero-Day-Malware, die von KI generiert wurde, mit mathematisch bewiesenen Garantien und überlegener Genauigkeit zu erkennen.

George Edwards, Mahdi EslamimehrWed, 11 Ma💻 cs

Class Model Generation from Requirements using Large Language Models

Diese Studie untersucht die Fähigkeit moderner Large Language Models, aus natürlichen Sprachanforderungen automatisch UML-Klassendiagramme zu generieren, und validiert deren Qualität durch ein umfassendes Dual-Validierungsframework, das LLM-basierte Bewertungen mit menschlicher Expertise kombiniert.

Jackson Nguyen, Rui En Koe, Fanyu Wang, Chetan Arora, Alessio FerrariWed, 11 Ma💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

Die Arbeit stellt AgenticCyOps vor, ein Sicherheitsframework für die Integration multi-agentischer KI-Systeme in Unternehmen, das durch die Identifizierung von Werkzeug-Orchestrierung und Speicher-Management als primäre Angriffsflächen sowie die Einführung von fünf defensiven Prinzipien und einer mehrschichtigen Verteidigungsarchitektur die Angriffsfläche im Vergleich zu herkömmlichen Systemen um mindestens 72 % reduziert.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

Das Paper stellt ToolRosetta vor, ein Framework, das Open-Source-Repositories automatisch in standardisierte, sicherheitsgeprüfte MCP-Tools für LLM-Agenten übersetzt, um die Skalierbarkeit und Leistung bei der Aufgabenerfüllung ohne manuelle Eingriffe zu verbessern.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

Die Studie zeigt, dass ChatGPT zwar in der Lage ist, realistische synthetische Systemanforderungsspezifikationen zu generieren, jedoch LLM-basierte Qualitätsbewertungen keine vollständige Ersatz für gründliche Expertenbewertungen darstellen können.

Alex R. Mattukat, Florian M. Braun, Horst LichterWed, 11 Ma💻 cs

Declarative Scenario-based Testing with RoadLogic

Die Arbeit stellt RoadLogic vor, ein Open-Source-System, das deklarative OpenSCENARIO-Spezifikationen mithilfe von Answer Set Programming, Bewegungsplanung und Überwachung in ausführbare, realistische Simulationen für das systematische Testen autonomer Fahrzeuge übersetzt.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

Dieser Erfahrungsbericht beschreibt die systematische Integration von Anforderungen an die Requirements-Engineering-Lehrinhalte in dynamische Software-Engineering-Lehrpläne für Berufstätige und leitet dabei grundlegende Prinzipien sowie einen Ansatz zur curricularen Abbildung ab.

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide FucciWed, 11 Ma💻 cs

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

Dieser Beitrag stellt das Artefaktmodell für regulatorische Requirements Engineering (AM4RRE) vor, das darauf abzielt, die systematische Integration von Compliance-by-Design in den Softwareentwicklungslebenszyklus durch die Überwindung von Herausforderungen wie komplexer Koordination zwischen verschiedenen Perspektiven und ad-hoc-Praktiken zu ermöglichen.

Oleksandr KosenkovWed, 11 Ma💻 cs

EmbC-Test: How to Speed Up Embedded Software Testing Using LLMs and RAG

Die Studie stellt einen RAG-basierten Ansatz vor, der durch die Nutzung von projektspezifischen Artefakten zur Generierung von Embedded-C-Tests die manuelle Testzeit um bis zu 66 % reduziert und dabei eine hohe syntaktische Korrektheit sowie eine erfolgreiche Laufzeitvalidierung von 85 % der generierten Tests erreicht.

Maximilian Harnot, Sebastian Komarnicki, Michal Polok, Timo OksanenWed, 11 Ma💻 cs

Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum

Dieser Artikel stellt ein praxisbasiertes Lehrkonzept vor, das agile Methoden und KI-Engineering integriert, um Studierende durch interdisziplinäre Teamprojekte mit KI-Tools auf die moderne Softwareentwicklung vorzubereiten und dabei sowohl technische Kompetenzen als auch kritische Reflexion zu fördern.

Andreas Rausch, Stefan Wittek, Tobias Geger, David InkermannWed, 11 Ma💻 cs

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Die Arbeit stellt EsoLang-Bench vor, einen Benchmark auf Basis esoterischer Programmiersprachen, der zeigt, dass große Sprachmodelle trotz hoher Leistungen bei Standardtests kaum genuine Reasoning-Fähigkeiten besitzen und stattdessen auf Memorierung angewiesen sind.

Aman Sharma, Paras ChopraWed, 11 Ma🤖 cs.AI

An Empirical Study of Interaction Smells in Multi-Turn Human-LLM Collaborative Code Generation

Diese Studie führt eine empirische Untersuchung von „Interaktionsgerüchen" in der mehrstufigen Mensch-LLM-Codegenerierung durch, stellt eine erste Taxonomie vor, analysiert deren Verteilung in verschiedenen Modellen und schlägt das Multi-Agenten-Framework InCE zur effektiven Minderung dieser Qualitätsprobleme vor.

Binquan Zhang, Li Zhang, Lin Shi, Song Wang, Yuwei Qian, Linhui Zhao, Fang Liu, An Fu, Yida YeWed, 11 Ma💻 cs

Towards a Neural Debugger for Python

Die Arbeit stellt „Neural Debuggers" vor, eine neue Klasse von Sprachmodellen, die traditionelle Debugger-Funktionen wie das Setzen von Haltepunkten und das schrittweise Durchlaufen von Code nachahmen, um sowohl die Vorwärts- als auch die Rückwärtsausführung von Python-Programmen zuverlässig zu modellieren und so die Grundlage für fortschrittlichere Agenten-basierte Codiersysteme zu legen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel SynnaeveWed, 11 Ma🤖 cs.AI

MORCoRA: Multi-Objective Refactoring Recommendation Considering Review Availability

Das Paper stellt MORCoRA vor, eine multi-objective Suchmethode, die nicht nur Code-Qualitätsverbesserungen und semantische Korrektheit anstrebt, sondern auch sicherstellt, dass die empfohlenen Refactoring-Sequenzen von verfügbaren und fachkundigen Entwicklern zeitnah geprüft werden können.

Lei Chen, Shinpei HayashiTue, 10 Ma💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Diese Arbeit untersucht das transformative Potenzial künstlicher Intelligenz zur Automatisierung und Optimierung der Testfallgenerierung und -validierung, wobei sie sowohl die gesteigerte Effizienz und Abdeckung als auch die Herausforderungen wie Datenqualität und die Balance zwischen Automatisierung und menschlicher Aufsicht beleuchtet.

Mohammad Baqar, Rajat KhandaTue, 10 Ma💻 cs

Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis

Diese Studie analysiert die Sicherheit und Qualität von Code, der von großen Sprachmodellen (LLMs) in verschiedenen Programmiersprachen generiert wurde, und stellt fest, dass die Modelle oft veraltete Methoden verwenden und moderne Sicherheitsfeatures nicht nutzen, was eine Weiterentwicklung zur Integration aktueller Best Practices erforderlich macht.

Mohammed Kharma, Soohyeon Choi, Mohammed AlKhanafseh, David MohaisenTue, 10 Ma🤖 cs.LG

Engineering Systems for Data Analysis Using Interactive Structured Inductive Programming

Das Paper stellt iProg vor, ein Werkzeug für interaktives strukturiertes induktives Programmieren, das durch eine zweistufige Kollaboration zwischen Mensch und KI (Zerlegung in Datenflussdiagramme und Codegenerierung) unter Nutzung eines Intelligibilitätsprotokolls wissenschaftliche Datenanalysesysteme schneller, qualitativ hochwertiger und zuverlässiger entwickelt als herkömmliche Low-Code- oder No-Code-Ansätze.

Shraddha Surana, Ashwin Srinivasan, Michael BainTue, 10 Ma💻 cs

← Zurück Weiter →