cs.SE 편의 논문 | Gist.Science

Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads

이 논문은 민감한 클라우드 워크로드를 처리하는 기업용 제로 트러스트 아키텍처인 'Lockbox'를 제안하며, 명시적 신뢰 검증과 강력한 격리, 최소 권한 원칙을 통해 AI 기반 분석과 같은 고급 기능을 도입하면서도 보안 태세를 유지할 수 있도록 합니다.

Vamshi Krishna Thotempudi, Mahima Agarwal, Raghav Batta, Anjali MangalWed, 11 Ma💻 cs

Automating Detection and Root-Cause Analysis of Flaky Tests in Quantum Software

이 논문은 양자 소프트웨어의 비결정적 특성으로 인한 '플래키 테스트'를 탐지하고 근본 원인을 분석하기 위해 대규모 언어 모델 (LLM) 을 활용한 자동화 파이프라인을 제안하며, 이를 통해 기존 데이터셋을 54% 확장하고 플래키 테스트 분류 및 원인 규명에서 높은 정확도를 입증했습니다.

Janakan Sivaloganathan, Ainaz Jamshidi, Andriy Miranskyy, Lei ZhangWed, 11 Ma🤖 cs.AI

The Future of Software Engineering Conferences: A New Zealand Perspective

이 논문은 뉴질랜드 연구자들이 겪는 소프트웨어 공학 컨퍼런스 참여의 장벽을 분석하고, 하이브리드 참여 확대와 비용 효율적 개최, 거버넌스 개혁 등을 통해 글로벌 참여의 형평성을 제고할 수 있는 방안을 제시합니다.

Kelly Blincoe, Sherlock A. Licorish, Judith Fuchs, Amjed TahirWed, 11 Ma💻 cs

Synergistic Directed Execution and LLM-Driven Analysis for Zero-Day AI-Generated Malware Detection

본 논문은 심층 학습 기반 취약점 분류와 강화 학습을 통한 피드백 루프가 통합된 하이브리드 분석 프레임워크를 제안하여, 기존 탐지 방식으로는 대응이 어려운 LLM 생성 제로데이 멀웨어를 높은 정확도로 탐지하고 그 이론적 보증을 제시합니다.

George Edwards, Mahdi EslamimehrWed, 11 Ma💻 cs

Class Model Generation from Requirements using Large Language Models

이 논문은 GPT-5 등 최신 대규모 언어 모델 (LLM) 을 활용하여 자연어 요구사항으로부터 UML 클래스 다이어그램을 자동 생성하고, 인간 전문가와 LLM 을 활용한 이중 검증 프레임워크를 통해 그 정확성과 신뢰성을 평가한 연구입니다.

Jackson Nguyen, Rui En Koe, Fanyu Wang, Chetan Arora, Alessio FerrariWed, 11 Ma💻 cs

AgenticCyOps: Securing Multi-Agentic AI Integration in Enterprise Cyber Operations

이 논문은 LLM 기반 다중 에이전트 시스템의 기업용 사이버 보안 통합을 위해 공격 표면을 체계적으로 분석하고, 도구 오케스트레이션과 메모리 관리를 핵심 신뢰 경계로 삼아 5 가지 방어 원칙을 정립하고 SOC 워크플로우에 적용하여 신뢰 경계를 72% 이상 축소하는 'AgenticCyOps' 프레임워크를 제안합니다.

Shaswata Mitra, Raj Patel, Sudip Mittal, Md Rayhanur Rahman, Shahram RahimiWed, 11 Ma💻 cs

ToolRosetta: Bridging Open-Source Repositories and Large Language Model Agents through Automated Tool Standardization

이 논문은 오픈소스 코드 저장소를 자동으로 표준화하여 LLM 에이전트가 신뢰성 있게 실행할 수 있는 MCP 호환 도구를 생성하고, 이를 통해 인간의 개입을 최소화하면서 다양한 과학 분야에서 작업 수행 능력을 향상시키는 'ToolRosetta' 프레임워크를 제안합니다.

Shimin Di, Xujie Yuan, Hanghui Guo, Chaoqian Ouyang, Zhangze Chen, Ling Yue, Libin Zheng, Jia Zhu, Shaowu Pan, Jian Yin, Min-Ling Zhang, Yong RuiWed, 11 Ma💻 cs

Can ChatGPT Generate Realistic Synthetic System Requirement Specifications? Results of a Case Study

이 논문은 ChatGPT 를 활용해 실제 시스템 요구사항 명세서 (SyRS) 에 접근하지 않고도 10 개 산업 분야에서 300 개의 합성 명세서를 생성한 탐색적 연구 결과를 바탕으로, 생성된 명세서가 전문가 평가에서 62% 의 현실성을 보였으나 모순과 결함이 발견되어 LLM 기반 품질 평가는 전문가 평가를 완전히 대체할 수 없음을 시사합니다.

Alex R. Mattukat, Florian M. Braun, Horst LichterWed, 11 Ma💻 cs

Declarative Scenario-based Testing with RoadLogic

이 논문은 자율주행차의 시나리오 기반 테스트를 위해 선언적 OpenSCENARIO 명세를 실행 가능한 시뮬레이션으로 자동 변환하는 오픈소스 도구 'RoadLogic'을 제안하고, 이를 통해 명세 준수성과 다양한 행동 변형을 효율적으로 검증할 수 있음을 입증합니다.

Ezio Bartocci, Alessio Gambi, Felix Gigler, Cristinel Mateis, Dejan NičkovicWed, 11 Ma🤖 cs.AI

Experience Report on the Adaptable Integration of Requirements Engineering Courses into Curricula for Professionals

이 논문은 기술 환경의 변화와 실무 요구사항에 대응하기 위해 전문가 대상 소프트웨어 공학 교육 과정에 요구사항 공학 과목을 체계적으로 통합하기 위한 경험, 기본 원칙 및 내용 매핑 중심의 접근법을 보고합니다.

Oleksandr Kosenkov, Konstantin Blaschke, Tony Gorschek, Michael Unterkalmsteiner, Oleksandr Adamov, Davide FucciWed, 11 Ma💻 cs

Towards Viewpoint-centric Artifact-based Regulatory Requirements Engineering for Compliance by Design

이 논문은 소프트웨어 공학에서 규제 준수를 설계 단계에 통합하기 위해 다양한 관점과 산출물을 중심으로 한 '규제 요구사항 공학을 위한 산출물 모델 (AM4RRE)'을 제안하고, 이를 통해 체계적인 규제 요구사항 공학 프로세스 구축을 위한 향후 연구 방향에 대한 피드백을 구하고 있습니다.

Oleksandr KosenkovWed, 11 Ma💻 cs

EmbC-Test: How to Speed Up Embedded Software Testing Using LLMs and RAG

이 논문은 프로젝트 특화 아티팩트를 기반으로 한 RAG 파이프라인을 활용해 임베디드 C 소프트웨어 테스트의 자동화를 달성함으로써 수동 작성 대비 최대 66% 의 시간을 단축하고 시간당 270 개의 테스트를 생성할 수 있음을 보여줍니다.

Maximilian Harnot, Sebastian Komarnicki, Michal Polok, Timo OksanenWed, 11 Ma💻 cs

Preparing Students for AI-Driven Agile Development: A Project-Based AI Engineering Curriculum

이 논문은 생성형 AI 와 에이전트 도구가 애자일 소프트웨어 개발을 재편하고 있는 시대에, 애자일 실무와 AI 역량을 통합한 프로젝트 기반 AI 엔지니어링 커리큘럼을 제안하고 그 효과와 시사점을 논의합니다.

Andreas Rausch, Stefan Wittek, Tobias Geger, David InkermannWed, 11 Ma💻 cs

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

이 논문은 대규모 언어 모델이 기존 코드 생성 벤치마크에서 높은 점수를 얻는 것이 단순 암기에 불과할 수 있음을 지적하며, 데이터 오염 가능성이 낮은 에소테릭 프로그래밍 언어를 활용한 'EsoLang-Bench'를 통해 모델들의 진정한 추론 능력을 평가했을 때 기존 벤치마크 점수와 극명하게 대비되는 낮은 성능을 확인했다고 요약할 수 있습니다.

Aman Sharma, Paras ChopraWed, 11 Ma🤖 cs.AI

An Empirical Study of Interaction Smells in Multi-Turn Human-LLM Collaborative Code Generation

이 논문은 다중 턴 인간-LLM 협업 코드 생성에서 발생하는 '상호작용 냄새 (Interaction Smells)'를 체계적으로 분류하고 분석하여, 전역 불변성 추출과 품질 감사를 통한 다중 에이전트 프레임워크인 InCE 를 제안함으로써 상호작용 품질을 개선하고 작업 성공률을 높이는 방법을 제시합니다.

Binquan Zhang, Li Zhang, Lin Shi, Song Wang, Yuwei Qian, Linhui Zhao, Fang Liu, An Fu, Yida YeWed, 11 Ma💻 cs

Towards a Neural Debugger for Python

이 논문은 기존 신경 해석기의 한계를 극복하고 프론트 및 백워드 실행을Debugger 동작에 따라 모델링하는 '신경 디버거'를 제안하여, 향후 에이전트 기반 코딩 시스템 및 자동화된 디버깅의 기반을 마련했다고 요약할 수 있습니다. 더 간결하게 한 문장으로 정리하면 다음과 같습니다: **이 논문은 프론트 및 백워드 실행을 디버거 동작에 따라 모델링하는 '신경 디버거'를 제안하여 향후 에이전트 기반 코딩 시스템과 자동화된 디버깅의 기반을 마련했습니다.**

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel SynnaeveWed, 11 Ma🤖 cs.AI

← 이전 다음 →

cs.SE