Quality Assurance of LLM-generated Code: Addressing Non-Functional Quality Characteristics

이 논문은 ISO/IEC 25010 품질 모델을 기반으로 문헌 검토, 산업계 워크숍, 실증 분석을 수행하여 생성된 코드의 비기능적 품질 (보안, 유지보수성, 성능 등) 에 대한 학술적 관심과 산업계의 우선순위 및 실제 모델 행동 간의 불일치를 드러내고, LLM 기반 코드 생성 파이프라인에 품질 보증 메커니즘을 통합할 필요성을 강조합니다.

Xin Sun, Daniel Ståhl, Kristian Sandahl, Christoph KesslerFri, 13 Ma🤖 cs.AI

DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

이 논문은 실행 가능한 도구 실행을 먼저 수행하고 이를 역으로 추론하여 작업을 생성하는 'DIVE' 프레임워크를 제안함으로써, 데이터 양 증가보다 다양성 확장이 도구 사용 LLM 의 일반화 성능을 획기적으로 향상시킨다는 것을 입증했습니다.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua XiaoFri, 13 Ma🤖 cs.AI

Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain

이 논문은 LLM 을 활용한 소프트웨어 설계의 품질을 향상시키기 위해 사용자 목표를 단계별 엔지니어링 절차와 자기 질문 (QoT) 체인으로 변환하는 새로운 프레임워크를 제안하고, 다양한 백엔드 도메인에서 모델 크기와 작업 복잡도에 따른 품질 개선 효과를 검증합니다.

Yen-Ku Liu, Yun-Cheng TsaiFri, 13 Ma🤖 cs.AI

Resolving Java Code Repository Issues with iSWE Agent

이 논문은 규칙 기반 정적 분석과 변환 도구를 활용하는 두 개의 하위 에이전트 (로컬라이제이션 및 편집) 로 구성된 iSWE 에이전트를 제안하여, 기존 모델들이 주로 파이썬에 집중했던 것과 달리 자바 코드 리포지토리의 이슈 해결 성능을 획기적으로 개선했음을 보여줍니다.

Jatin Ganhotra, Sami Serhan, Antonio Abu Nassar, Avraham Shinnar, Ziv Nevo, Martin HirzelFri, 13 Ma🤖 cs.AI

Dance of the ADS: Orchestrating Failures through Historically-Informed Scenario Fuzzing

이 논문은 오픈드라이브 (OPENDRIVE) 맵 데이터와 그래프 신경망을 활용해 과거 테스트 데이터를 기반으로 고위험 시나리오를 예측·선별하는 'ScenarioFuzz'를 제안함으로써, 기존 방법 대비 시간 비용을 60.3% 절감하고 단위 시간당 발견되는 오류 시나리오를 103% 증가시켜 자율주행 시스템의 안전성을 검증하는 새로운 패러다임을 제시합니다.

Tong Wang, Taotao Gu, Huan Deng + 3 more2026-03-11🤖 cs.AI

Exploration of Evolving Quantum Key Distribution Network Architecture Using Model-Based Systems Engineering

이 논문은 양자 컴퓨팅의 위협에 대응하기 위해 모델 기반 시스템 공학 기법을 활용하여 양자 키 분배 네트워크 아키텍처의 진화를 체계적으로 모델링하고, 이해관계자의 요구를 반영한 유연한 네트워크 설계를 위한 변이성 기반 프레임워크를 제안합니다.

Hayato Ishida, Amal Elsokary, Maria Aslam + 3 more2026-03-10⚛️ quant-ph

Automated TEE Adaptation with LLMs: Identifying, Transforming, and Porting Sensitive Functions in Programs

이 논문은 개발자의 개입을 최소화하여 기존 프로그램의 민감한 함수를 식별하고 TEE(신뢰 실행 환경) 호환 버전으로 자동 변환하는 최초의 LLM 기반 도구인 AUTOTEE 를 제안하고, 자바와 파이썬 환경에서 높은 정확도와 성공률을 입증합니다.

Ruidong Han, Zhou Yang, Chengyan Ma, Ye Liu, Yuqing Niu, Siqi Ma, Debin Gao, David Lo2026-03-06🔒 cs.CR

Assessing the Impact of Code Changes on the Fault Localizability of Large Language Models

이 논문은 기존 벤치마크의 데이터 오염과 확장성 한계를 극복하기 위해 의미 보존 변이를 활용한 새로운 평가 프레임워크를 제안하고, 대규모 실험을 통해 현재 대형 언어 모델의 결함 국소화 능력이 실제 의미론적 추론보다는 문법적 단서에 과도하게 의존하고 있음을 규명했습니다.

Sabaat Haroon, Ahmad Faraz Khan, Ahmad Humayun + 5 more2026-03-06💻 cs

RefAgent: A Multi-agent LLM-based Framework for Automatic Software Refactoring

이 논문은 계획, 실행, 테스트 및 자기 반성을 통해 소프트웨어 리팩토링을 자동화하는 다중 에이전트 LLM 프레임워크인 RefAgent 를 제안하고, 오픈 소스 자바 프로젝트에서의 실험을 통해 기존 단일 에이전트 방식 및 기존 도구 대비 우수한 코드 품질 향상과 리팩토링 기회 식별 능력을 입증합니다.

Khouloud Oueslati, Maxime Lamothe, Foutse Khomh2026-03-06💻 cs

Refactoring for Novices in Java: An Eye Tracking Study on the Extract vs. Inline Methods

이 연구는 32 명의 Java 초보자를 대상으로 한 아이 트래킹 실험을 통해, 추출 리팩토링이 복잡한 작업에서는 이해도와 성능을 향상시키지만 단순한 작업에서는 오히려 탐색 빈도와 소요 시간을 증가시켜 초보자에게는 과도한 모듈화가 비효율적일 수 있음을 밝혔습니다.

José Aldo Silva da Costa, Rohit Gheyi, José Júnior Silva da Costa + 5 more2026-03-06💻 cs