Spatial Autoregressive Modeling of DINOv3 Embeddings for Unsupervised Anomaly Detection

이 논문은 DINOv3 임베딩의 공간적 및 문맥적 의존성을 명시적으로 모델링하는 2 차 자기회귀 (AR) 모델을 제안하여, 기존 메모리 뱅크 기반 방법의 계산 및 메모리 오버헤드를 줄이면서도 의료 영상 이상 탐지에서 경쟁력 있는 성능을 달성하는 효율적인 비지도 프레임워크를 제시합니다.

Ertunc Erdil, Nico Schulthess, Guney Tombak + 1 more2026-03-04💻 cs

BRIGHT: A Collaborative Generalist-Specialist Foundation Model for Breast Pathology

이 논문은 4 만 명 이상의 환자로부터 수집된 210 만 개의 조직 슬라이드 타일로 학습된 'BRIGHT'라는 유방 병리 전용 기초 모델을 제안하여, 일반적 전문성과 기관별 특화 지식을 결합한 협업 프레임워크를 통해 다양한 임상 과제에서 기존 일반 모델들을 능가하는 최첨단 성능을 입증했습니다.

Xiaojing Guo, Jiatai Lin, Yumian Jia + 39 more2026-03-04💻 cs

TikZilla: Scaling Text-to-TikZ with High-Quality Data and Reinforcement Learning

이 논문은 대규모 언어 모델이 텍스트 설명을 고품질의 TikZ 과학 도표로 변환하는 능력을 향상시키기 위해, DaTikZ-V4 라는 대규모 고품질 데이터셋을 구축하고 역그래픽 기반 이미지 인코더를 활용한 강화 학습을 도입한 'TikZilla' 모델을 제안하며, 이를 통해 GPT-4o 를 능가하고 GPT-5 와 대등한 성능을 달성함을 보여줍니다.

Christian Greisinger, Steffen Eger2026-03-04💬 cs.CL

Conditioned Activation Transport for T2I Safety Steering

이 논문은 선형 활성화 조정이 이미지 품질을 저하시키는 문제를 해결하기 위해 안전하지 않은 영역에서만 비선형 운송 맵을 활성화하는 '조건부 활성화 수송 (CAT)' 프레임워크를 제안하고, 이를 통해 텍스트 - 이미지 모델의 안전성을 유지하면서 이미지 충실도를 보존함을 입증합니다.

Maciej Chrabąszcz, Aleksander Szymczyk, Jan Dubiński + 3 more2026-03-04🤖 cs.AI

MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization

이 논문은 오버모달 LLM 에서 발생하는 교차 모달 환각을 완화하기 위해, 관련 없는 모달리티의 왜곡에 대한 불변성과 관련 모달리티의 변화에 대한 민감성을 강제하며 텍스트 편향을 줄이는 '모달리티 분리 선호 최적화 (MoD-DPO)' 프레임워크를 제안하고 그 유효성을 입증합니다.

Ashutosh Chaubey, Jiacheng Pang, Mohammad Soleymani2026-03-04💬 cs.CL

ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments

이 논문은 다양한 물리적 구현체에 공통적으로 필요한 공간 지능을 공유 기반대로 활용하여, SSR(기반 구축 - 전문화 - 조화) 패러다임과 GRPO 최적화를 통해 자율 주행, 로봇, UAV 등을 아우르는 범용 embodied intelligence 모델인 ACE-Brain-0 을 제안하고 다양한 벤치마크에서 최첨단 성능을 입증했습니다.

Ziyang Gong, Zehang Luo, Anke Tang + 21 more2026-03-04💬 cs.CL

COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design

이 논문은 다양한 지구 관측 센서 데이터 간의 비단일적 관계를 확률적으로 모델링하여, 재학습 없이도 다양한 조건에서 물리적으로 일관된 다중 모달 데이터 생성과 번역을 가능하게 하는 COP-GEN 이라는 잠재 확산 트랜스포머를 제안합니다.

Miguel Espinosa, Eva Gmelich Meijling, Valerio Marsocci + 2 more2026-03-04💻 cs

DuoMo: Dual Motion Diffusion for World-Space Human Reconstruction

이 논문은 잡음이 많거나 불완전한 비제약 비디오에서 전 세계 좌표계의 인간 움직임을 복원하기 위해 카메라 좌표계와 전 세계 좌표계로 운동을 분해하는 두 개의 확산 모델을 결합한 'DuoMo'를 제안하여 기존 방법 대비 전 세계 복원 오차를 크게 줄이고 파라메트릭 모델을 우회하여 메쉬 꼭짓점을 직접 생성하는 최첨단 성능을 달성했다고 요약할 수 있습니다.

Yufu Wang, Evonne Ng, Soyong Shin + 8 more2026-03-04💻 cs