CycleBEV: Regularizing View Transformation Networks via View Cycle Consistency for Bird's-Eye-View Semantic Segmentation

이 논문은 자율주행의 비전 기반 BEV 세그멘테이션 성능을 향상시키기 위해, 학습 단계에서만 활용되는 역뷰 변환 네트워크를 통해 뷰 사이클 일관성 정규화 프레임워크인 CycleBEV 를 제안하고 다양한 변환 모델에서 일관된 성능 개선을 입증합니다.

Jeongbin Hong, Dooseop Choi, Taeg-Hyun An + 2 more2026-03-02🤖 cs.AI

BuildAnyPoint: 3D Building Structured Abstraction from Diverse Point Clouds

이 논문은 다양한 분포의 포인트 클라우드로부터 구조화된 3D 건물 추상화를 위해, 노이즈가 있거나 희소한 점으로부터 분포를 복원하는 조건부 잠재 확산 모델과 이를 기반으로 컴팩트한 메쉬를 생성하는 오토레귀시브 트랜스포머를 결합한 새로운 생성 프레임워크인 BuildAnyPoint 를 제안합니다.

Tongyan Hua, Haoran Gong, Yuan Liu + 3 more2026-03-02💻 cs

Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering

이 논문은 LLM 기반 의미 분해와 QR 직교화를 통해 '과거 비교' 축만을 표적으로 하는 훈련 불필요 추론 제어 프레임워크인 SDLS 를 제안하여, 방사선 보고서 생성 시 과거 소견에 기반한 환각을 억제하면서도 임상적 정확도를 향상시키는 방법을 제시합니다.

Ao Li, Rui Liu, Mingjie Li + 6 more2026-03-02💻 cs

Can Unified Generation and Understanding Models Maintain Semantic Equivalence Across Different Output Modalities?

이 논문은 통합 멀티모달 대규모 언어 모델이 텍스트 기반 추론에서는 탁월한 성능을 보이지만, 동일한 추론 결과를 이미지 생성으로 표현할 때 의미적 일관성이 무너지는 '시각적 생성 이해'의 한계를 VGUBench 를 통해 규명하고, 이 문제가 생성 품질 부족이 아닌 교차 모달 의미 정렬의 실패에서 기인함을 시사합니다.

Hongbo Jiang, Jie Li, Yunhang Shen + 4 more2026-03-02💻 cs

UTPTrack: Towards Simple and Unified Token Pruning for Visual Tracking

이 논문은 시각적 객체 추적의 계산 비용을 줄이면서도 정확도를 유지하기 위해 검색 영역, 동적 템플릿, 정적 템플릿을 통합적으로 압축하는 새로운 단일 토큰 가지치기 프레임워크인 UTPTrack 을 제안하고, 다양한 벤치마크에서 기존 방법보다 뛰어난 성능과 효율성을 입증합니다.

Hao Wu, Xudong Wang, Jialiang Zhang + 5 more2026-03-02💬 cs.CL