Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

이 논문은 미니배치 최적 수송, 모듈형 정규화, 그리고 지도 정보 통합을 통해 기존 이산적 방법의 확장성 한계와 신경망 접근법의 복잡성을 극복하고, 다양한 분야에서 새로운 최첨단 성능을 달성하는 확률 측도 공간의 와세르슈타인 그래디언트 흐름 기반의 확장 가능하고 정규화된 바리센터 계산 알고리즘을 제안합니다.

Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell2026-03-10🤖 cs.LG

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

이 논문은 비전, 오디오, 언어 모듈을 각각 최적의 가속기에 매핑하는 하드웨어-소프트웨어 공동 설계 프레임워크 'NANOMIND'를 제안하여, 배터리 구동 소형 장치에서 대규모 멀티모달 모델의 온디바이스 추론 시 에너지 효율과 처리량을 획기적으로 향상시켰음을 보여줍니다.

Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee2026-03-10💬 cs.CL

Deliberative Dynamics and Value Alignment in LLM Debates

이 논문은 Reddit 의 'Am I the Asshole' 데이터셋을 기반으로 GPT-4.1, Claude 3.7 Sonnet, Gemini 2.0 Flash 등 주요 LLM 들이 동기식 및 순차식 토론 프로토콜 하에서 어떻게 다른 수정률, 가치 우선순위, 그리고 순서 효과에 따른 순응 행동을 보이는지 분석하여 다중 턱 환경에서의 LLM 의 의식적 역동성과 가치 정렬을 규명합니다.

Pratik S. Sachdeva, Tom van Nuenen2026-03-10💻 cs

Reallocating Attention Across Layers to Reduce Multimodal Hallucination

이 논문은 다중 모달 대형 추론 모델의 환각 현상을 완화하기 위해, 기존 모델의 재학습이나 구조 변경 없이 레이어별 주의 집중을 감지 및 추론 헤드로 식별하여 적응적으로 재조정하는 경량화 플러그인 'Functional Head Identification and Class-Conditioned Rescaling'을 제안합니다.

Haolang Lu, Bolun Chu, WeiYe Fu, Guoshun Nan, Junning Liu, Minghui Pan, Qiankun Li, Yi Yu, Hua Wang, Kun Wang2026-03-10💻 cs

Ego-Vision World Model for Humanoid Contact Planning

이 논문은 시뮬레이션 없이 학습된 세계 모델과 샘플 기반 모델 예측 제어 (MPC) 를 결합하여, 인간형 로봇이 proprioception 과 이고센트릭 깊이 이미지를 통해 물리적 접촉을 활용하는 작업을 실시간으로 안정적으로 수행할 수 있도록 하는 새로운 프레임워크를 제안합니다.

Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath2026-03-10💻 cs

ARM-FM: Automated Reward Machines via Foundation Models for Compositional Reinforcement Learning

이 논문은 파운데이션 모델의 추론 능력을 활용하여 자연어 명세로부터 보상 기계 (Reward Machines) 를 자동으로 생성하고, 이를 통해 강화학습의 과업을 구성적으로 분해하며 제로샷 일반화까지 가능하게 하는 'ARM-FM' 프레임워크를 제안합니다.

Roger Creus Castanyer, Faisal Mohamed, Pablo Samuel Castro, Cyrus Neary, Glen Berseth2026-03-10🤖 cs.LG

Explainable Heterogeneous Anomaly Detection in Financial Networks via Adaptive Expert Routing

이 논문은 금융 시장의 다양한 이상 징후 (가격 충격, 유동성 동결 등) 를 식별하고 그 원인을 설명할 수 있도록, 적응형 그래프 학습과 메커니즘별 전문가 라우팅을 결합한 해석 가능한 이질적 이상 탐지 프레임워크를 제안하며, 이를 통해 기존 방법보다 정밀한 조기 경보와 행동 가능한 통찰력을 제공합니다.

Zan Li, Rui Fan2026-03-10🤖 cs.LG

Reinforcing Numerical Reasoning in LLMs for Tabular Prediction via Structural Priors

이 논문은 열의 순열 불변성을 구조적 사전 지식으로 인코딩한 순열 상대 정책 최적화 (PRPO) 기반 강화학습 프레임워크를 제안하여, 대규모 언어 모델이 표 데이터 예측에서 기존 최첨단 모델들을 능가하는 수치 추론 능력을 발휘하도록 함으로써 적은 감독 하에서도 탁월한 성능을 달성함을 보여줍니다.

Pengxiang Cai, Zihao Gao, Wanchen Lian, Jintai Chen2026-03-10🤖 cs.LG

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

본 논문은 자율주행의 하류 인식 작업 성능 향상을 위해 3D 어셋 렌더링과 세계 모델 미세 조정을 결합한 새로운 합성 데이터 생성 프레임워크인 Dream4Drive 와 대규모 3D 자산 데이터셋을 제안하여, 기존 방법론의 한계를 극복하고 다양한 훈련 조건에서 인식 모델의 성능을 효과적으로 개선함을 보여줍니다.

Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang2026-03-10💻 cs

Human-Centered LLM-Agent System for Detecting Anomalous Digital Asset Transactions

이 논문은 비전문가가 자연어로 분석 의도를 표현하고 구조화된 위험 증거를 검토하며 추적 가능한 전문가 수준의 추론을 얻을 수 있도록 설계된 인간 중심의 다중 에이전트 시스템 HCLA 를 통해 디지털 자산 거래의 이상 탐지 과정에서 설명 가능성과 책임성을 동시에 강화하는 새로운 패러다임을 제시합니다.

Gyuyeon Na, Minjung Park, Hyeonjeong Cha, Sangmi Chai2026-03-10💻 cs

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

이 논문은 DINOv2 기반의 비지도 시각 표현을 활용하여 객체 범주에 구애받지 않는 시각적 반복과 구조 학습을 통해 객체 수를 추정하는 'CountFormer' 프레임워크를 제안하고, FSC-147 벤치마크에서 경쟁력 있는 성능을 보이며 표현의 질이 표본 없는 객체 수 세기에서 중요한 역할을 함을 입증합니다.

Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen2026-03-10💻 cs

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

이 논문은 일회성 탐사를 통해 강건한 공간 - 시맨틱 상관관계를 가진 통합 3D 언어 메모리를 구축하고, 이를 활용하여 다중 목표 시각 내비게이션 및 오픈-보카불러리 질의에 있어 기존 최첨단 방법들을 크게 능가하는 성능을 보이는 'LagMemo' 시스템을 제안합니다.

Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao2026-03-10💻 cs

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

이 논문은 MinishLab 의 Potion-base-8M 증류 모델을 기반으로 Rust 로 구현된 SwiftEmbed 를 소개하며, 정적 토큰 조회와 제로-카피 직렬화를 통해 1.12ms 의 초저지연성과 50,000 RPS 의 처리량을 달성하면서도 MTEB 평균 60.6 점의 성능을 유지하는 실시간 텍스트 임베딩 시스템을 제안합니다.

Edouard Lansiaux, Antoine Simonet, Eric Wiel2026-03-10💬 cs.CL