Hindsight Credit Assignment for Long-Horizon LLM Agents

이 논문은 희소 보상 환경에서 장기적 할당 문제를 해결하기 위해 사후 추론을 통해 단계별 가치 추정과 기준선을 정교화하는 새로운 프레임워크인 HCAPO 를 제안하며, WebShop 과 ALFWorld 등 다양한 벤치마크에서 기존 최첨단 방법론보다 뛰어난 성과를 입증했습니다.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

이 논문은 군 GG가 공간 MM에 전이적으로 작용할 때, X×MX \times M 위의 GG-불변 함수를 MM의 등방성 부분군 HHXX에 작용하는 불변 함수로 명시적으로 축소하는 이론을 제시하여, 기존 방법의 구조적 제약을 해소하고 임의의 군 작용과 균질한 조건부 공간에 적용 가능한 일반화된 등변 신경장 (Equivariant Neural Fields) 을 확장합니다.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

Clear, Compelling Arguments: Rethinking the Foundations of Frontier AI Safety Cases

이 논문은 항공, 원자력 등 안전 중대 산업에서 발전한 안전 사례 (safety case) 방법론의 교훈을 바탕으로, 정렬 (alignment) 커뮤니티의 기존 접근법의 한계를 지적하고 프런티어 AI 시스템의 안전성을 입증하기 위한 더 견고하고 포괄적인 안전 사례 프레임워크를 제안합니다.

Shaun Feakins, Ibrahim Habli, Phillip Morgan2026-03-11🤖 cs.AI

Large Language Model-Assisted Superconducting Qubit Experiments

이 논문은 지식 기반을 활용해 도구 생성 및 호출을 자동화하는 대규모 언어 모델 (LLM) 프레임워크를 제안하여 초전도 큐비트의 제어 및 측정 실험을 자동화하고, 공진기 특성 분석 및 양자 비파괴 측정 재현 등 다양한 실험을 성공적으로 수행한 사례를 소개합니다.

Shiheng Li, Jacob M. Miller, Phoebe J. Lee, Gustav Andersson, Christopher R. Conner, Yash J. Joshi, Bayan Karimi, Amber M. King, Howard L. Malc, Harsh Mishra, Hong Qiao, Minseok Ryu, Xuntao Wu, Siyuan Xing, Haoxiong Yan, Jian Shi, Andrew N. Cleland2026-03-11⚛️ quant-ph

Test-Driven AI Agent Definition (TDAD): Compiling Tool-Using Agents from Behavioral Specifications

이 논문은 프롬프트를 실행 가능한 테스트로 변환하고 이를 기반으로 반복적으로 개선하는 '테스트 주도 AI 에이전트 정의 (TDAD)' 방법론을 제안하여, 도구 사용형 LLM 에이전트의 행동 준수성을 측정 가능하게 하고 배포 전 사양 게임링 및 회귀 오류를 방지하는 체계를 제시합니다.

Tzafrir Rehan2026-03-11🤖 cs.AI

Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams

이 논문은 자연어 지시에서 작업 관련 정보를 추출하여 불필요한 정보를 필터링하고 구조화된 그래프 탐색을 통해 효율적인 장기 계획 생성을 가능하게 하는 확장 가능한 다중 로봇 팀 작업 계획 프레임워크인 'Scale-Plan'을 제안하고, 이를 통해 기존 LLM 기반 접근법의 한계를 극복하고 신뢰성과 확장성을 향상시켰음을 보여줍니다.

Piyush Gupta, Sangjae Bae, Jiachen Li, David Isele2026-03-11🤖 cs.AI

Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage

이 논문은 TREC NeuCLIR 2024, TREC RAG 2024, WikiVideo 등 다양한 벤치마크를 통해 검색 단계의 정보 커버리지 지표가 RAG 시스템의 최종 생성 응답 품질을 예측하는 신뢰할 수 있는 지표가 될 수 있음을 실증적으로 입증했습니다.

Saron Samuel, Alexander Martin, Eugene Yang, Andrew Yates, Dawn Lawrie, Ian Soborof, Laura Dietz, Benjamin Van Durme2026-03-11🤖 cs.AI

MASEval: Extending Multi-Agent Evaluation from Models to Systems

이 논문은 LLM 기반 에이전트 시스템의 성능에 모델뿐만 아니라 토폴로지나 오케스트레이션 로직과 같은 구현 선택도 결정적인 영향을 미친다는 점을 강조하며, 전체 시스템을 분석 단위로 삼아 프레임워크 간 비교를 가능하게 하는 'MASEval' 평가 프레임워크를 제안합니다.

Cornelius Emde, Alexander Rubinstein, Anmol Goel, Ahmed Heakl, Sangdoo Yun, Seong Joon Oh, Martin Gubri2026-03-11🤖 cs.AI

A Lightweight Multi-Cancer Tumor Localization Framework for Deployable Digital Pathology

이 논문은 4 가지 암종으로 훈련된 경량화 다중 암종 종양 국소화 모델 (MuCTaL) 이 새로운 암종에서도 높은 성능을 보이며, 디지털 병리학에 배포 가능한 확장성 있는 공간 종양 확률 히트맵 생성 워크플로우를 제시합니다.

Brian Isett, Rebekah Dadey, Aofei Li, Ryan C. Augustin, Kate Smith, Aatur D. Singhi, Qiangqiang Gu, Riyue Bao2026-03-11🤖 cs.AI

LDP: An Identity-Aware Protocol for Multi-Agent LLM Systems

이 논문은 다중 에이전트 LLM 시스템의 효율성과 거버넌스를 향상시키기 위해 모델 정체성, 점진적 페이로드, 통제된 세션, 구조화된 출처 추적, 신뢰 도메인 등 다섯 가지 메커니즘을 도입한 AI 네이티브 통신 프로토콜인 LDP(LLM Delegate Protocol) 를 제안하고, 이를 통해 지연 시간 감소와 토큰 효율성 증대 등의 효과를 입증했습니다.

Sunil Prakash2026-03-11🤖 cs.AI

Unpacking Interpretability: Human-Centered Criteria for Optimal Combinatorial Solutions

이 논문은 최적의 조합 해법 중 인간이 이해하기 쉬운 것을 선택하게 하는 실험을 통해, 해법의 구조적 특성 (그리드 휴리스틱 정렬, 단순한 구성, 정렬된 시각적 표현) 이 해석 가능성에 결정적인 영향을 미친다는 것을 규명하고, 이를 통해 최적성과 해석 가능성 간의 균형을 고려한 알고리즘 설계의 기반을 마련했습니다.

Dominik Pegler, Frank Jäkel, David Steyrl, Frank Scharnowski, Filip Melinscak2026-03-11🤖 cs.AI

A New Modeling to Feature Selection Based on the Fuzzy Rough Set Theory in Normal and Optimistic States on Hybrid Information Systems

이 논문은 하이브리드 정보 시스템에서 고차원 공간의 계산 비용과 노이즈 문제를 해결하기 위해, 객체 간 결합 거리를 기반으로 한 새로운 퍼지 근사 집합 기반 특성 선택 모델 (FSbuHD) 을 제안하고 이를 정상 및 낙관적 두 가지 모드에서 최적화 문제로 재구성하여 UCI 데이터셋을 통해 기존 방법들보다 효율성과 효과성이 입증되었음을 보여줍니다.

Mohammad Hossein Safarpour, Seyed Mohammad Alavi, Mohammad Izadikhah, Hossein Dibachi2026-03-11🤖 cs.AI

NetDiffuser: Deceiving DNN-Based Network Attack Detection Systems with Diffusion-Generated Adversarial Traffic

이 논문은 네트워크 트래픽의 독립적인 특징을 식별하고 확산 모델을 활용하여 자연스러운 적대적 예제를 생성함으로써 딥러닝 기반 네트워크 침입 탐지 시스템의 성능을 효과적으로 우회하는 새로운 프레임워크 'NetDiffuser'를 제안합니다.

Pratyay Kumar, Abu Saleh Md Tayeen, Satyajayant Misra, Huiping Cao, Jiefei Liu, Qixu Gong, Jayashree Harikumar2026-03-11🤖 cs.AI