Adaptive Social Learning via Mode Policy Optimization for Language Agents

이 논문은 언어 에이전트가 사회적 상호작용의 맥락에 따라 직관적 반응에서 심층적 고찰까지 적응적으로 추론 깊이를 조절할 수 있도록 하는 '적응형 사회적 학습 (ASL)' 프레임워크와 '적응형 모드 정책 최적화 (AMPO)' 알고리즘을 제안하여, 기존 방법 대비 뛰어난 성능과 토큰 효율성을 입증했습니다.

Minzheng Wang, Yongbin Li, Haobo Wang + 6 more2026-03-04🤖 cs.AI

Talk to Your Slides: High-Efficiency Slide Editing via Language-Driven Structured Data Manipulation

이 논문은 멀티모달 LLM 기반의 GUI 에이전트가 겪는 높은 비용과 지연 시간을 해결하기 위해, 슬라이드의 시각적 픽셀 대신 객체 모델 기반의 구조화된 데이터 조작을 통해 텍스트 중심 편집 및 배치 처리 효율성을 극대화하는 'Talk-to-Your-Slides' 에이전트와 이를 평가하는 TSBench 벤치마크를 제안합니다.

Kyudan Jung, Hojun Cho, Jooyeol Yun + 3 more2026-03-04💬 cs.CL

Efficient Agent Training for Computer Use

이 논문은 312 개의 인간 주석 데이터와 Claude 3.7 Sonnet 을 활용한 데이터 증강 기법을 결합한 'PC Agent-E'프레임워크를 제안하여, 인간 행동 데이터만 학습한 모델이나 직접적인 증류 방식보다 월등히 뛰어난 성능을 달성하고 WindowsAgentArena-V2 벤치마크에서 Claude 3.7 Sonnet 을 능가하는 결과를 보였음을 소개합니다.

Yanheng He, Jiahe Jin, Pengfei Liu2026-03-04🤖 cs.AI

BitBypass: A New Direction in Jailbreaking Aligned Large Language Models with Bitstream Camouflage

이 논문은 안전 정렬된 대규모 언어 모델의 취약점을 악용하여 새로운 블랙박스 탈옥 공격 기법인 'BitBypass'를 제안하고, 하이픈으로 구분된 비트스트림 위장 기법을 통해 기존 공격들보다 뛰어난 은닉성과 성공률을 보이며 최신 모델들의 안전 장벽을 우회할 수 있음을 입증했습니다.

Kalyan Nakka, Nitesh Saxena2026-03-04💬 cs.CL

HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models

이 논문은 STEM 중심의 기존 벤치마크의 한계를 극복하고 인문사회과학 (HSS) 분야의 다국어 평가와 교차 학문적 추론 능력을 측정하기 위해 전문가와 자동 에이전트의 협업을 통해 13,000 개 이상의 샘플로 구성된 'HSSBench'를 제안하고, 이를 통해 최신 다중모달 대규모 언어 모델들이 여전히 큰 도전에 직면해 있음을 입증합니다.

Zhaolu Kang, Junhao Gong, Jiaxu Yan + 15 more2026-03-04🤖 cs.AI