Lockbox -- A Zero Trust Architecture for Secure Processing of Sensitive Cloud Workloads
이 논문은 민감한 클라우드 워크로드를 처리하는 기업용 제로 트러스트 아키텍처인 'Lockbox'를 제안하며, 명시적 신뢰 검증과 강력한 격리, 최소 권한 원칙을 통해 AI 기반 분석과 같은 고급 기능을 도입하면서도 보안 태세를 유지할 수 있도록 합니다.
172 편의 논문
이 논문은 민감한 클라우드 워크로드를 처리하는 기업용 제로 트러스트 아키텍처인 'Lockbox'를 제안하며, 명시적 신뢰 검증과 강력한 격리, 최소 권한 원칙을 통해 AI 기반 분석과 같은 고급 기능을 도입하면서도 보안 태세를 유지할 수 있도록 합니다.
이 논문은 양자 소프트웨어의 비결정적 특성으로 인한 '플래키 테스트'를 탐지하고 근본 원인을 분석하기 위해 대규모 언어 모델 (LLM) 을 활용한 자동화 파이프라인을 제안하며, 이를 통해 기존 데이터셋을 54% 확장하고 플래키 테스트 분류 및 원인 규명에서 높은 정확도를 입증했습니다.
이 논문은 뉴질랜드 연구자들이 겪는 소프트웨어 공학 컨퍼런스 참여의 장벽을 분석하고, 하이브리드 참여 확대와 비용 효율적 개최, 거버넌스 개혁 등을 통해 글로벌 참여의 형평성을 제고할 수 있는 방안을 제시합니다.
본 논문은 심층 학습 기반 취약점 분류와 강화 학습을 통한 피드백 루프가 통합된 하이브리드 분석 프레임워크를 제안하여, 기존 탐지 방식으로는 대응이 어려운 LLM 생성 제로데이 멀웨어를 높은 정확도로 탐지하고 그 이론적 보증을 제시합니다.
이 논문은 GPT-5 등 최신 대규모 언어 모델 (LLM) 을 활용하여 자연어 요구사항으로부터 UML 클래스 다이어그램을 자동 생성하고, 인간 전문가와 LLM 을 활용한 이중 검증 프레임워크를 통해 그 정확성과 신뢰성을 평가한 연구입니다.
이 논문은 LLM 기반 다중 에이전트 시스템의 기업용 사이버 보안 통합을 위해 공격 표면을 체계적으로 분석하고, 도구 오케스트레이션과 메모리 관리를 핵심 신뢰 경계로 삼아 5 가지 방어 원칙을 정립하고 SOC 워크플로우에 적용하여 신뢰 경계를 72% 이상 축소하는 'AgenticCyOps' 프레임워크를 제안합니다.
이 논문은 오픈소스 코드 저장소를 자동으로 표준화하여 LLM 에이전트가 신뢰성 있게 실행할 수 있는 MCP 호환 도구를 생성하고, 이를 통해 인간의 개입을 최소화하면서 다양한 과학 분야에서 작업 수행 능력을 향상시키는 'ToolRosetta' 프레임워크를 제안합니다.
이 논문은 ChatGPT 를 활용해 실제 시스템 요구사항 명세서 (SyRS) 에 접근하지 않고도 10 개 산업 분야에서 300 개의 합성 명세서를 생성한 탐색적 연구 결과를 바탕으로, 생성된 명세서가 전문가 평가에서 62% 의 현실성을 보였으나 모순과 결함이 발견되어 LLM 기반 품질 평가는 전문가 평가를 완전히 대체할 수 없음을 시사합니다.
이 논문은 자율주행차의 시나리오 기반 테스트를 위해 선언적 OpenSCENARIO 명세를 실행 가능한 시뮬레이션으로 자동 변환하는 오픈소스 도구 'RoadLogic'을 제안하고, 이를 통해 명세 준수성과 다양한 행동 변형을 효율적으로 검증할 수 있음을 입증합니다.
이 논문은 기술 환경의 변화와 실무 요구사항에 대응하기 위해 전문가 대상 소프트웨어 공학 교육 과정에 요구사항 공학 과목을 체계적으로 통합하기 위한 경험, 기본 원칙 및 내용 매핑 중심의 접근법을 보고합니다.
이 논문은 소프트웨어 공학에서 규제 준수를 설계 단계에 통합하기 위해 다양한 관점과 산출물을 중심으로 한 '규제 요구사항 공학을 위한 산출물 모델 (AM4RRE)'을 제안하고, 이를 통해 체계적인 규제 요구사항 공학 프로세스 구축을 위한 향후 연구 방향에 대한 피드백을 구하고 있습니다.
이 논문은 프로젝트 특화 아티팩트를 기반으로 한 RAG 파이프라인을 활용해 임베디드 C 소프트웨어 테스트의 자동화를 달성함으로써 수동 작성 대비 최대 66% 의 시간을 단축하고 시간당 270 개의 테스트를 생성할 수 있음을 보여줍니다.
이 논문은 생성형 AI 와 에이전트 도구가 애자일 소프트웨어 개발을 재편하고 있는 시대에, 애자일 실무와 AI 역량을 통합한 프로젝트 기반 AI 엔지니어링 커리큘럼을 제안하고 그 효과와 시사점을 논의합니다.
이 논문은 대규모 언어 모델이 기존 코드 생성 벤치마크에서 높은 점수를 얻는 것이 단순 암기에 불과할 수 있음을 지적하며, 데이터 오염 가능성이 낮은 에소테릭 프로그래밍 언어를 활용한 'EsoLang-Bench'를 통해 모델들의 진정한 추론 능력을 평가했을 때 기존 벤치마크 점수와 극명하게 대비되는 낮은 성능을 확인했다고 요약할 수 있습니다.
이 논문은 다중 턴 인간-LLM 협업 코드 생성에서 발생하는 '상호작용 냄새 (Interaction Smells)'를 체계적으로 분류하고 분석하여, 전역 불변성 추출과 품질 감사를 통한 다중 에이전트 프레임워크인 InCE 를 제안함으로써 상호작용 품질을 개선하고 작업 성공률을 높이는 방법을 제시합니다.
이 논문은 기존 신경 해석기의 한계를 극복하고 프론트 및 백워드 실행을Debugger 동작에 따라 모델링하는 '신경 디버거'를 제안하여, 향후 에이전트 기반 코딩 시스템 및 자동화된 디버깅의 기반을 마련했다고 요약할 수 있습니다. 더 간결하게 한 문장으로 정리하면 다음과 같습니다: **이 논문은 프론트 및 백워드 실행을 디버거 동작에 따라 모델링하는 '신경 디버거'를 제안하여 향후 에이전트 기반 코딩 시스템과 자동화된 디버깅의 기반을 마련했습니다.**
이 논문은 코드 품질 향상과 함께 적절한 리뷰어의 전문성과 업무 부하를 고려하여 즉각적인 검토가 가능한 리팩토링 시퀀스와 리뷰어를 추천하는 다목적 검색 기반 기법인 MORCoRA 를 제안하고 그 유효성을 검증합니다.
이 논문은 인공지능이 테스트 케이스 생성 및 검증을 자동화하고 적응력을 높여 소프트웨어 테스트의 효율성, 정확성 및 확장성을 혁신적으로 개선할 수 있는 잠재력과 함께 데이터 품질, 투명성, 인간 감독의 균형 등 해결해야 할 과제를 탐구합니다.
이 논문은 다양한 프로그래밍 언어와 LLM 모델을 대상으로 생성된 코드의 보안 및 품질을 분석한 결과, 모델들이 최신 보안 기능을 활용하지 못하고 구식 방법을 사용하는 등 언어별 보안 효율성에 차이가 있음을 밝혀냈습니다.
이 논문은 인간과 LLM 간의 상호작용을 통해 데이터 분석 워크플로우를 선언적 표현으로 분해하고 코드를 생성하는 'iProg' 도구를 제안하며, 천체물리학과 생화학 분야의 사례를 통해 기존 노코드 방식보다 성능과 코드 품질이 우수하며 개발 속도가 획기적으로 향상됨을 입증합니다.