DIVE: Scaling Diversity in Agentic Task Synthesis for Generalizable Tool Use

이 논문은 실행 가능한 도구 실행을 먼저 수행하고 이를 역으로 추론하여 작업을 생성하는 'DIVE' 프레임워크를 제안함으로써, 데이터 양 증가보다 다양성 확장이 도구 사용 LLM 의 일반화 성능을 획기적으로 향상시킨다는 것을 입증했습니다.

Aili Chen, Chi Zhang, Junteng Liu, Jiangjie Chen, Chengyu Du, Yunji Li, Ming Zhong, Qin Wang, Zhengmao Zhu, Jiayuan Song, Ke Ji, Junxian He, Pengyu Zhao, Yanghua Xiao2026-03-13🤖 cs.AI

Quality-Driven Agentic Reasoning for LLM-Assisted Software Design: Questions-of-Thoughts (QoT) as a Time-Series Self-QA Chain

이 논문은 LLM 을 활용한 소프트웨어 설계의 품질을 향상시키기 위해 사용자 목표를 단계별 엔지니어링 절차와 자기 질문 (QoT) 체인으로 변환하는 새로운 프레임워크를 제안하고, 다양한 백엔드 도메인에서 모델 크기와 작업 복잡도에 따른 품질 개선 효과를 검증합니다.

Yen-Ku Liu, Yun-Cheng Tsai2026-03-13🤖 cs.AI

A Survey of Reasoning in Autonomous Driving Systems: Open Challenges and Emerging Paradigms

본 논문은 자율주행 시스템의 핵심 병목 현상인 추론 능력의 부재를 해결하기 위해 인지 계층 구조를 제안하고, 대규모 언어 모델 기반의 통합 프레임워크를 체계적으로 분석하며, 지연 시간과 안전성 간의 긴장 관계를 해소할 수 있는 신경-기호적 아키텍처 등 향후 연구 방향을 제시합니다.

Kejin Yu, Yuhan Sun, Taiqiang Wu, Ruixu Zhang, Zhiqiang Lin, Yuxin Meng, Junjie Wang, Yujiu Yang2026-03-13🤖 cs.AI

Thousand-GPU Large-Scale Training and Optimization Recipe for AI-Native Cloud Embodied Intelligence Infrastructure

이 논문은 LeRobot 프레임워크를 기반으로 데이터 파이프라인 재구조화, 모델 최적화 (FlashAttention, FP8 등), 그리고 고성능 인프라 구축을 통해 그라 00T-N1.5 모델의 학습 속도를 40 배 가속화한 천 개 GPU 규모의 대규모 분산 학습 플랫폼과 종단 간 평가 시스템을 제시합니다.

Chen Zhou, Haoran Sun, Hedan Yang, Jing Long, Junwu Xiong, Luqiao Wang, Mingxi Luo, Qiming Yang, Shuai Di, Song Wang, Tianyun Zhao, Wanting Xu, Wen Huang, Xiaodong Bai, Xiaomeng Tian, Xiaolong Xiang, Yicheng Gong, Yongjian Guo, Yucheng Guo, Yunxuan Ma, Yu Wei, Zhong Guan, Zhen Sun2026-03-13🤖 cs.AI

WebWeaver: Breaking Topology Confidentiality in LLM Multi-Agent Systems with Stealthy Context-Based Inference

이 논문은 LLM 다중 에이전트 시스템의 토폴로지 기밀성을 침해하는 새로운 공격 프레임워크인 'WebWeaver'를 제안하며, 단일 에이전트의 컨텍스트만 활용하여 기존 방법보다 훨씬 은밀하고 정확하게 전체 토폴로지를 추론하는 방식을 제시합니다.

Zixun Xiong, Gaoyi Wu, Lingfeng Yao, Miao Pan, Xiaojiang Du, Hao Wang2026-03-13🤖 cs.AI

Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

이 논문은 비디오 비전 트랜스포머 모델에서 '성공 대 실패'라는 결과 신호가 어텐션 헤드가 증거를 수집하고 MLP 블록이 개념을 구성하는 분산된 인과 회로를 통해 점진적으로 증폭되는 메커니즘을 규명함으로써, 단순 분류 작업만 수행하는 모델 내부에도 신뢰할 수 있는 AI 를 구축하기 위해 파악해야 할 숨겨진 지식이 존재함을 보여줍니다.

Sai V R Chereddy2026-03-13🤖 cs.LG

PACED: Distillation at the Frontier of Student Competence

이 논문은 지식 증류 시 학생 모델이 이미 숙달했거나 도달 불가능한 문제에서 발생하는 계산 낭비를 이론적으로 규명하고, 학생 모델의 역량 한계 부근의 문제에 집중하도록 설계된 'PACED' 프레임워크를 제안하여 다양한 증류 시나리오에서 성능을 획기적으로 향상시킨다는 내용입니다.

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-13🤖 cs.AI

Measuring AI Agents' Progress on Multi-Step Cyber Attack Scenarios

이 논문은 2024 년 8 월부터 2026 년 2 월까지 출시된 7 가지 최첨단 AI 모델을 기업 네트워크 및 산업 제어 시스템 사이버 공격 시나리오에서 평가한 결과, 추론 시 계산량 증가와 모델 세대 발전에 따라 다단계 공격 수행 능력이 비약적으로 향상되었음을 보여줍니다.

Linus Folkerts, Will Payne, Simon Inman, Philippos Giavridis, Joe Skinner, Sam Deverett, James Aung, Ekin Zorer, Michael Schmatz, Mahmoud Ghanem, John Wilkinson, Alan Steer, Vy Hong, Jessica Wang2026-03-13🤖 cs.AI

MDER-DR: Multi-Hop Question Answering with Entity-Centric Summaries

이 논문은 지식 그래프 기반의 다단계 질문 응답 (QA) 에서 삼중항 (triple) 변환 시 발생하는 맥락 손실 문제를 해결하기 위해, 엔터티 중심 요약과 통합 인덱싱 기법 (MDER) 과 질의 분해 및 추론 메커니즘 (DR) 을 결합한 새로운 RAG 프레임워크를 제안하고, 이를 통해 기존 베이스라인 대비 최대 66% 의 성능 향상을 입증했습니다.

Riccardo Campi, Nicolò Oreste Pinciroli Vago, Mathyas Giudici, Marco Brambilla, Piero Fraternali2026-03-13💬 cs.CL

Markovian Generation Chains in Large Language Models

이 논문은 대규모 언어 모델이 이전 출력을 기반으로 반복적으로 텍스트를 생성하는 '마르코프 생성 사슬' 과정을 분석하여, 온도 파라미터와 초기 입력에 따라 문장 다양성이 증가하거나 감소할 수 있음을 규명하고 다중 에이전트 시스템에 대한 시사점을 제시합니다.

Mingmeng Geng, Amr Mohamed, Guokan Shang, Michalis Vazirgiannis, Thierry Poibeau2026-03-13💬 cs.CL