DocSage: An Information Structuring Agent for Multi-Doc Multi-Entity Question Answering

이 논문은 여러 문서와 개체에 걸친 질문 응답의 한계를 극복하기 위해 동적 스키마 발견, 구조화된 정보 추출, 스키마 인식 추론을 통합한 에이전트 프레임워크 'DocSage'를 제안하고, 이를 통해 기존 LLM 및 RAG 시스템 대비 27% 이상의 정확도 향상을 달성했음을 보여줍니다.

Teng Lin, Yizhang Zhu, Zhengxuan Zhang, Yuyu Luo, Nan Tang2026-03-13🤖 cs.AI

Automating Skill Acquisition through Large-Scale Mining of Open-Source Agentic Repositories: A Framework for Multi-Agent Procedural Knowledge Extraction

이 논문은 GitHub 의 오픈소스 에이전트 저장소를 대규모로 마이닝하여 시각화 및 교육 기능을 포함한 고수준 절차적 지식을 자동 추출하고 표준화함으로써, 모델 재학습 없이 대형 언어 모델의 자율 워크플로우 능력을 확장하는 프레임워크를 제시합니다.

Shuzhen Bi, Mengsong Wu, Hao Hao, Keqian Li, Wentao Liu, Siyu Song, Hongbo Zhao, Aimin Zhou2026-03-13🤖 cs.AI

RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset

이 논문은 인간의 개입 없이 비전 - 언어 모델, 그래프 신경망 정책, 자동 성공 평가 및 비동기적 환경 재설정 메커니즘을 통합하여 로봇 학습을 위한 대규모 물리적 상호작용 데이터를 자율적으로 생성하는 폐루프 시스템 'RADAR'를 제안합니다.

Yongzhong Wang, Keyu Zhu, Yong Zhong, Liqiong Wang, Jinyu Yang, Feng Zheng2026-03-13🤖 cs.AI

VisiFold: Long-Term Traffic Forecasting via Temporal Folding Graph and Node Visibility

이 논문은 장기 교통 예측 시 발생하는 계산 비용 증가와 복잡한 시공간 의존성 문제를 해결하기 위해, 시간적 프레임을 단일 그래프로 통합하는 '시간 접이 그래프'와 노드 가시성 메커니즘을 도입한 VisiFold 프레임워크를 제안하여 기존 방법들보다 자원 효율성과 예측 정확도를 동시에 향상시켰음을 보여줍니다.

Zhiwei Zhang, Xinyi Du, Weihao Wang, Xuanchi Guo, Wenjuan Han2026-03-13🤖 cs.AI

Automated Detection of Malignant Lesions in the Ovary Using Deep Learning Models and XAI

본 논문은 Mendeley 의 조직병리학 데이터셋을 활용하여 LeNet-5, ResNet, VGGNet, GoogLeNet 등 15 가지 딥러닝 변형 모델을 비교 분석하고, LIME, Integrated Gradients, SHAP 등의 설명 가능한 인공지능 (XAI) 기법을 적용하여 난소 암 악성 병변의 자동 탐지 정확도를 94% 로 높인 연구 결과를 제시합니다.

Md. Hasin Sarwar Ifty, Nisharga Nirjan, Labib Islam, M. A. Diganta, Reeyad Ahmed Ornate, Anika Tasnim, Md. Saiful Islam2026-03-13🤖 cs.AI

You Told Me to Do It: Measuring Instructional Text-induced Private Data Leakage in LLM Agents

이 논문은 고권한 LLM 에이전트가 외부 문서에 숨겨진 악성 지시를 신뢰할 수 있는 실행자로 간주하여 실행함으로써 발생하는 구조적 취약점 '신뢰받는 실행자 딜레마'를 규명하고, 이를 통해 문서 기반 지시 주입 공격이 현재까지 효과적인 방어책 없이 심각한 데이터 유출 위협으로 남아있음을 입증합니다.

Ching-Yu Kao, Xinfeng Li, Shenyu Dai, Tianze Qiu, Pengcheng Zhou, Eric Hanchen Jiang, Philip Sperl2026-03-13🤖 cs.AI

CreativeBench: Benchmarking and Enhancing Machine Creativity via Self-Evolving Challenges

이 논문은 기계 창의성을 정량적으로 평가하기 위한 벤치마크인 CreativeBench 를 제안하고, 모델 확장 시 창의성 유형별 상이한 패턴을 분석하며 EvoRePE 라는 추론 시간 전략을 통해 기계 창의성을 지속적으로 향상시키는 방법을 제시합니다.

Zi-Han Wang, Lam Nguyen, Zhengyang Zhao, Mengyue Yang, Chengwei Qin, Yujiu Yang, Linyi Yang2026-03-13🤖 cs.AI

AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization

AdaFuse 는 토큰 단위의 사전 게이트링 전략과 커스텀 CUDA 커널 최적화를 통해 동적 어댑터 추론 시 발생하는 CUDA 커널 오버헤드를 해결하여, 정확도 유지하면서 추론 지연 시간을 2.4 배 이상 단축하는 프레임워크를 제안합니다.

Qiyang Li, Rui Kong, Yuchen Li, Hengyi Cai, Shuaiqiang Wang, Linghe Kong, Guihai Chen, Dawei Yin2026-03-13🤖 cs.AI

Bielik-Minitron-7B: Compressing Large Language Models via Structured Pruning and Knowledge Distillation for the Polish Language

이 논문은 NVIDIA 의 Minitron 접근 방식을 차용한 구조적 가지치기와 지식 증류, 그리고 정렬 파이프라인을 통해 폴란드어 및 유럽어에 최적화된 110 억 파라미터 모델인 Bielik-11B-v3.0 을 73.5 억 파라미터로 압축하면서도 베이스 모델 성능의 약 90% 를 유지하고 추론 속도를 최대 50% 향상시킨 Bielik-Minitron-7B 모델을 개발한 과정을 상세히 설명합니다.

Remigiusz Kinas, Paweł Kiszczak, Sergio P. Perez, Krzysztof Ociepa, Łukasz Flis, Krzysztof Wróbel, Adrian Gwozdziej2026-03-13💬 cs.CL

Think While Watching: Online Streaming Segment-Level Memory for Multi-Turn Video Reasoning in Multimodal Large Language Models

이 논문은 연속적으로 들어오는 비디오 스트림에서 멀티턴 상호작용을 위한 지속적인 세그먼트 수준의 기억을 보존하고, '보면서 동시에 생각하기' 방식을 통해 온라인 추론 성능을 획기적으로 개선하는 'Think While Watching' 프레임워크를 제안합니다.

Lu Wang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Zhuoran Jin (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yupu Hao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yubo Chen (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Kang Liu (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China), Yulong Ao (Beijing Academy of Artificial Intelligence), Jun Zhao (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences, Beijing, China)2026-03-13💬 cs.CL

EnTransformer: A Deep Generative Transformer for Multivariate Probabilistic Forecasting

이 논문은 에너지 기반 스코링 목적 함수와 엔그레션 (engression) 을 결합하여 파라미터적 가정을 피하면서도 상관관계가 있는 다변량 시계열의 복잡한 결합 예측 분포를 학습하고 일관된 확률적 예측을 생성하는 새로운 딥 생성 트랜스포머 모델인 'EnTransformer'를 제안하고, 다양한 벤치마크 데이터셋에서 기존 모델보다 우수한 성능을 입증합니다.

Rajdeep Pathak, Rahul Goswami, Madhurima Panja, Palash Ghosh, Tanujit Chakraborty2026-03-13📊 stat

Understanding LLM Behavior When Encountering User-Supplied Harmful Content in Harmless Tasks

본 논문은 LLM 이 겉보기에 무해한 작업을 수행할 때 사용자 제공 유해 콘텐츠를 처리하는지 여부를 평가한 결과, 최신 모델조차도 인간 윤리 정렬에 실패하여 유해 정보를 계속 처리하는 경향이 있음을 발견하고, 이를 완화하기 위한 안전 조치 강화의 필요성을 제기합니다.

Junjie Chu, Yiting Qu, Ye Leng, Michael Backes, Yun Shen, Savvas Zannettou, Yang Zhang2026-03-13🤖 cs.AI

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

이 논문은 모바일 기기를 위한 효율적인 커널 생성이 현재 LLM 의 한계로 인해 어렵다는 점을 MobileKernelBench 를 통해 규명하고, 이를 극복하기 위해 제안한 다중 에이전트 시스템 MoKA 가 높은 컴파일 성공률과 성능 개선을 달성했음을 보여줍니다.

Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang2026-03-13🤖 cs.LG