Deliberative Dynamics and Value Alignment in LLM Debates

이 논문은 Reddit 의 'Am I the Asshole' 데이터셋을 기반으로 GPT-4.1, Claude 3.7 Sonnet, Gemini 2.0 Flash 등 주요 LLM 들이 동기식 및 순차식 토론 프로토콜 하에서 어떻게 다른 수정률, 가치 우선순위, 그리고 순서 효과에 따른 순응 행동을 보이는지 분석하여 다중 턱 환경에서의 LLM 의 의식적 역동성과 가치 정렬을 규명합니다.

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

이 논문은 다중 모달 대형 추론 모델의 환각 현상을 완화하기 위해, 기존 모델의 재학습이나 구조 변경 없이 레이어별 주의 집중을 감지 및 추론 헤드로 식별하여 적응적으로 재조정하는 경량화 플러그인 'Functional Head Identification and Class-Conditioned Rescaling'을 제안합니다.

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

이 논문은 시뮬레이션 없이 학습된 세계 모델과 샘플 기반 모델 예측 제어 (MPC) 를 결합하여, 인간형 로봇이 proprioception 과 이고센트릭 깊이 이미지를 통해 물리적 접촉을 활용하는 작업을 실시간으로 안정적으로 수행할 수 있도록 하는 새로운 프레임워크를 제안합니다.

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

이 논문은 파운데이션 모델의 추론 능력을 활용하여 자연어 명세로부터 보상 기계 (Reward Machines) 를 자동으로 생성하고, 이를 통해 강화학습의 과업을 구성적으로 분해하며 제로샷 일반화까지 가능하게 하는 'ARM-FM' 프레임워크를 제안합니다.

Roger Creus Castanyer, Faisal Mohamed, Pablo Samuel Castro, Cyrus Neary, Glen Berseth2026-03-10🤖 cs.LG

Explainable Heterogeneous Anomaly Detection in Financial Networks via Adaptive Expert Routing

이 논문은 금융 시장의 다양한 이상 징후 (가격 충격, 유동성 동결 등) 를 식별하고 그 원인을 설명할 수 있도록, 적응형 그래프 학습과 메커니즘별 전문가 라우팅을 결합한 해석 가능한 이질적 이상 탐지 프레임워크를 제안하며, 이를 통해 기존 방법보다 정밀한 조기 경보와 행동 가능한 통찰력을 제공합니다.

Zan Li, Rui Fan2026-03-10🤖 cs.LG

Reinforcing Numerical Reasoning in LLMs for Tabular Prediction via Structural Priors

이 논문은 열의 순열 불변성을 구조적 사전 지식으로 인코딩한 순열 상대 정책 최적화 (PRPO) 기반 강화학습 프레임워크를 제안하여, 대규모 언어 모델이 표 데이터 예측에서 기존 최첨단 모델들을 능가하는 수치 추론 능력을 발휘하도록 함으로써 적은 감독 하에서도 탁월한 성능을 달성함을 보여줍니다.

Pengxiang Cai, Zihao Gao, Wanchen Lian, Jintai Chen2026-03-10🤖 cs.LG

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

본 논문은 자율주행의 하류 인식 작업 성능 향상을 위해 3D 어셋 렌더링과 세계 모델 미세 조정을 결합한 새로운 합성 데이터 생성 프레임워크인 Dream4Drive 와 대규모 3D 자산 데이터셋을 제안하여, 기존 방법론의 한계를 극복하고 다양한 훈련 조건에서 인식 모델의 성능을 효과적으로 개선함을 보여줍니다.

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

이 논문은 비전문가가 자연어로 분석 의도를 표현하고 구조화된 위험 증거를 검토하며 추적 가능한 전문가 수준의 추론을 얻을 수 있도록 설계된 인간 중심의 다중 에이전트 시스템 HCLA 를 통해 디지털 자산 거래의 이상 탐지 과정에서 설명 가능성과 책임성을 동시에 강화하는 새로운 패러다임을 제시합니다.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

이 논문은 DINOv2 기반의 비지도 시각 표현을 활용하여 객체 범주에 구애받지 않는 시각적 반복과 구조 학습을 통해 객체 수를 추정하는 'CountFormer' 프레임워크를 제안하고, FSC-147 벤치마크에서 경쟁력 있는 성능을 보이며 표현의 질이 표본 없는 객체 수 세기에서 중요한 역할을 함을 입증합니다.

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

이 논문은 일회성 탐사를 통해 강건한 공간 - 시맨틱 상관관계를 가진 통합 3D 언어 메모리를 구축하고, 이를 활용하여 다중 목표 시각 내비게이션 및 오픈-보카불러리 질의에 있어 기존 최첨단 방법들을 크게 능가하는 성능을 보이는 'LagMemo' 시스템을 제안합니다.

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

이 논문은 MinishLab 의 Potion-base-8M 증류 모델을 기반으로 Rust 로 구현된 SwiftEmbed 를 소개하며, 정적 토큰 조회와 제로-카피 직렬화를 통해 1.12ms 의 초저지연성과 50,000 RPS 의 처리량을 달성하면서도 MTEB 평균 60.6 점의 성능을 유지하는 실시간 텍스트 임베딩 시스템을 제안합니다.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

이 논문은 BCI Competition IV-2a 데이터셋을 기반으로 해석 가능한 ANFIS-FBCSP-PSO 모델과 EEGNet 을 비교하여, 단일 사용자 환경에서는 전자가, 사용자 간 일반화 성능에서는 후자가 우세함을 입증함으로써 MI-BCI 시스템 설계 시 해석성과 강건성 중 어떤 목표를 우선시할지에 대한 실용적 지침을 제시합니다.

Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid2026-03-10🤖 cs.LG

Towards Efficient Federated Learning of Networked Mixture-of-Experts for Mobile Edge Computing

이 논문은 모바일 엣지 컴퓨팅 환경에서 리소스 제약을 극복하기 위해 전문가 기반의 협업 추론과 개인화 및 일반화를 균형 있게 달성하는 연방 학습 프레임워크를 통합한 '네트워크형 혼합 전문가 (NMoE)' 시스템을 제안합니다.

Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai2026-03-10🤖 cs.LG

FATE: A Formal Benchmark Series for Frontier Algebra of Multiple Difficulty Levels

이 논문은 대학원 수준을 넘어선 추상 대수학 문제를 포함하는 새로운 벤치마크 'FATE'를 제안하고, 최신 대형 언어 모델들이 수학 경시대회 대비 연구 수준의 형식적 추론에서 극심한 성능 격차와 형식화 과정에서의 한계를 드러냈음을 보고합니다.

Jiedong Jiang, Wanyi He, Yuefeng Wang, Guoxiong Gao, Yongle Hu, Jingting Wang, Nailin Guan, Peihao Wu, Chunbo Dai, Liang Xiao, Bin Dong2026-03-10🤖 cs.LG

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

이 논문은 인간 멘토의 논문을 기반으로 가설 수립, 실험, 논문 작성까지 수행하는 자율 AI 시스템 'Jr. AI Scientist'를 개발하고, 기존 자동화 시스템보다 높은 평가 점수를 얻은 성과를 입증하는 동시에 현재 시스템의 한계와 잠재적 위험을 종합적으로 분석하여 AI 과학 연구의 신뢰성과 지속 가능성을 위한 통찰을 제공합니다.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG