Does the Question Really Matter? Training-Free Data Selection for Vision-Language SFT

이 논문은 질문의 유무에 따른 답변 타당성 평가의 차이를 측정하여 고품질의 시각 - 언어 결합 추론이 필요한 데이터를 비용 효율적으로 선별하는 'CVS'라는 학습 없는 데이터 선택 방법을 제안하고, 이를 통해 적은 데이터로 더 높은 성능을 달성함을 입증합니다.

Peng Sun, Huawen Shen, Yi Ban, Tianfan Fu, Yanbo Wang, Yuqiang Li2026-03-11🤖 cs.AI

AutoAgent: Evolving Cognition and Elastic Memory Orchestration for Adaptive Agents

이 논문은 정적 인지, 경직된 워크플로우, 비효율적인 컨텍스트 활용이라는 기존 자율 에이전트의 한계를 극복하기 위해 진화하는 인지, 실시간 상황 기반 의사결정, 탄력적인 기억 오케스트레이션을 통합한 자가 진화형 멀티 에이전트 프레임워크인 'AutoAgent'를 제안하고, 다양한 벤치마크에서 뛰어난 적응성과 성능을 입증합니다.

Xiaoxing Wang, Ning Liao, Shikun Wei, Chen Tang, Feiyu Xiong2026-03-11🤖 cs.AI

RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation

이 논문은 논문 저자의 반박 (rebuttal) 을 암시적 지도 신호로 활용하여 구체적이고 실행 가능한 리뷰 피드백을 생성하는 새로운 프레임워크 'RbtAct'와 대규모 데이터셋을 제안하고, 이를 통해 기존 모델보다 실행 가능성과 구체성이 향상된 리뷰를 생성함을 보여줍니다.

Sihong Wu, Yiling Ma, Yilun Zhao, Tiansheng Hu, Owen Jiang, Manasi Patwardhan, Arman Cohan2026-03-11🤖 cs.AI

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

이 논문은 실제 1 인칭 비디오를 기반으로 한 'EXPLORE-Bench' 벤치마크를 제안하여, 다중 모달 대규모 언어 모델이 1 인칭 관점에서 행동의 장기적 물리적 결과를 추론하는 데 여전히 한계가 있음을 규명하고, 단계별 추론을 통한 성능 개선 가능성을 제시합니다.

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun Zha2026-03-11🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

이 논문은 3D 재구성과 인스턴스 분할을 활용하여 구조화된 공간 인지 지도와 할로센트릭-공간 트리 (AST) 를 구축함으로써, 추가 학습 없이도 멀티모달 및 텍스트 전용 기반 모델의 공간 추론 능력을 획기적으로 향상시키는 'World2Mind' 툴킷을 제안합니다.

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin Wang2026-03-11🤖 cs.AI

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

이 논문은 시뮬레이션 기반 추론 (SBI) 기법을 활용하여 중성미자 유도 핵자 방출 모델의 매개변수를 추정함으로써, 기존 MicroBooNE 실험의 경험적 튜닝보다 더 나은 적합도를 달성하고 다른 시뮬레이션 모델 (NuWro) 에도 적용 가능성을 입증했습니다.

Karla Tame-Narvaez, Steven Gardiner, Aleksandra Ciprijanovic, Giuseppe Cerati2026-03-11⚛️ hep-ph

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

이 논문은 다수의 embodied 에이전트로부터 수집된 장기 시점의 이기중심 비디오를 동시에 이해하는 새로운 문제를 정의하고, 이를 평가하기 위한 MA-EgoQA 벤치마크와 공유 메모리 및 동적 검색을 활용한 EgoMAS 기반 모델을 제안하며, 현재 모델들이 다중 스트림 처리에 한계가 있음을 보여줍니다.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

이 논문은 복잡한 환경에서 물체 간 접촉으로 인한 역학을 명시적으로 모델링한 '동역학 인식 정책 학습 (DAPL)' 프레임워크를 제안하여, 수동적 조작의 한계를 극복하고 혼잡한 장면에서도 성공적인 외재적 민첩성을 실현하는 방법을 제시합니다.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

이 논문은 연속적인 LLM 파인튜닝 중 발생하는 catastrophic forgetting 을 완화하면서도 빠른 적응을 유지하기 위해, 샘플 수준의 기억 강도를 추정하고 적응형 간격으로 재연습을 스케줄링하는 메모리 인식 적응형 재연습 프레임워크인 MSSR 을 제안하고 다양한 벤치마크에서 기존 방법들을 능가하는 성능을 입증합니다.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

이 논문은 비동일한 데이터 파이프라인과 표준화된 평가 부재라는 한계를 해결하기 위해, 24 가지 의료 모달리티와 11 가지 이기종 다중 에이전트 아키텍처를 통합하고 자동화된 임상 추론 평가 체계를 갖춘 멀티모달 의료 다중 에이전트 시스템 벤치마킹 프레임워크인 MedMASLab 을 제안합니다.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI