Unsupervised Domain Adaptation with Target-Only Margin Disparity Discrepancy

이 논문은 제한된 공개 데이터로 인한 간 분할의 어려움을 해결하기 위해, CT 데이터를 소스로 활용하고 마진 불일치 불일치 (MDD) 를 기반으로 한 새로운 비지도 도메인 적응 프레임워크를 제안하여 개입 방사선학의 CBCT 영상에서 간 분할 성능을 획기적으로 향상시켰음을 보여줍니다.

Gauthier Miralles, Loïc Le Folgoc, Vincent Jugnon, Pietro Gori2026-03-11💻 cs

From Semantics to Pixels: Coarse-to-Fine Masked Autoencoders for Hierarchical Visual Understanding

이 논문은 의미적, 인스턴스, 픽셀 수준의 세 가지 데이터 세분성을 명시적으로 학습하는 계층적 구조와 점진적 마스킹 커리큘럼을 통해 대비 학습과 마스킹 이미지 모델링 간의 긴장 관계를 해결하고 더 강력하고 일반화 가능한 시각 표현을 학습하는 C2FMAE 를 제안합니다.

Wenzhao Xiang, Yue Wu, Hongyang Yu, Feng Gao, Fan Yang, Xilin Chen2026-03-11🤖 cs.LG

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

이 논문은 가려진 영역을 포함한 국소 이동 가능 영역을 예측하기 위해 시각 - 언어 모델에 공간 단서를 주입하고 깊이 기반 특징을 융합하는 BEACON 을 제안하여, 가려진 목표 위치가 있는 환경에서 기존 이미지 공간 기반 방법보다 이동성 예측 정확도를 크게 향상시킨다고 설명합니다.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

ReCoSplat: Autoregressive Feed-Forward Gaussian Splatting Using Render-and-Compare

이 논문은 예측된 카메라 포즈의 오차를 보정하기 위해 렌더링 및 비교 (Render-and-Compare) 모듈을 도입하고, 긴 시퀀스 처리를 위해 하이브리드 KV 캐시 압축 전략을 적용하여 포즈 유무 및 카메라 내부 파라미터 유무에 관계없이 온라인 신관 합성에서 최첨단 성능을 달성하는 오토레거시 피드포워드 가우스 스플래팅 모델인 ReCoSplat 을 제안합니다.

Freeman Cheng, Botao Ye, Xueting Li, Junqi You, Fangneng Zhan, Ming-Hsuan Yang2026-03-11💻 cs

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

이 논문은 기존 초과완전 표현 (superposition) 이론이 상관관계를 고려하지 않은 이상적인 가정에 기반하고 있음을 지적하고, 실제 데이터의 상관관계가 간섭을 단순한 노이즈가 아닌 구성적 요소로 활용하여 의미적 클러스터와 순환 구조를 자연스럽게 형성한다는 'Bag-of-Words Superposition (BOWS)' 모델을 통해 이를 설명합니다.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI

Differentiable Microscopy Designs an All Optical Phase Retrieval Microscope

이 논문은 미러링 현미경 설계에 필요한 전문 지식과 창의성을 보완하기 위해 제안된 '미분 가능 현미경 (μ\partial\mu)' 프레임워크를 통해 데이터 기반의 위상 재현 현미경 설계를 성공적으로 구현하고 실험적으로 검증했음을 보여줍니다.

Kithmini Herath, Hasindu Kariyawasam, Ramith Hettiarachchi, Udith Haputhanthri, Dineth Jayakody, Raja N. Ahmad, Azeem Ahmad, Balpreet S. Ahluwalia, Chamira U. S. Edussooriya, Dushan N. Wadduwage2026-03-10🔬 physics.optics

Class Overwhelms: Mutual Conditional Blended-Target Domain Adaptation

이 논문은 도메인 레이블 없이도 불확실성 기반의 범주형 판별자와 저수준 특징 증강을 통해 P(ZY)P(Z|Y)P(YZ)P(Y|Z)를 상호 조건부로 정렬하는 새로운 메커니즘을 제안함으로써, 레이블 분포 편이와 불균형이 존재하는 블렌디드 타겟 도메인 적응 (BTDA) 의 성능을 기존 최첨단 방법보다 크게 향상시킵니다.

Pengcheng Xu, Boyu Wang, Charles Ling2026-03-10💻 cs

DivCon: Divide and Conquer for Complex Numerical and Spatial Reasoning in Text-to-Image Generation

이 논문은 복잡한 수치 및 공간 추론을 요구하는 텍스트-이미지 생성의 한계를 극복하기 위해, 레이아웃 예측과 이미지 생성 단계를 분할하여 경량 LLM 도 정밀한 레이아웃을 생성하고 객체를 난이도 순서로 합성하는 'DivCon' 방법을 제안하고, 이를 통해 HRS 및 NSR-1K 벤치마크에서 기존 방법보다 우수한 성능을 입증했습니다.

Yuhao Jia, Wenhan Tan2026-03-10💻 cs

Goldilocks Test Sets for Face Verification

이 논문은 기존 얼굴 인식 모델이 고질적 한계를 보이는 실제적인 어려움 (큰 속성 차이, 작은 속성 차이, 유사한 외모) 을 해결하기 위해 인위적 화질 저하 없이 고품질로 구성된 '골디락스' 수준의 새로운 테스트셋 (Hadrian, Eclipse, ND-Twins) 을 제안하고 있습니다.

Haiyu Wu, Sicong Tian, Aman Bhatta, Jacob Gutierrez, Grace Bezold, Genesis Argueta, Karl Ricanek Jr., Michael C. King, Kevin W. Bowyer2026-03-10💻 cs

ExpGest: Expressive Speaker Generation Using Diffusion Model and Hybrid Audio-Text Guidance

이 논문은 오디오와 텍스트 정보를 동기화하여 감정과 전신 움직임을 자연스럽게 생성하는 새로운 확산 기반 프레임워크인 ExpGest 를 제안하며, 기존 방법들의 한계를 극복하고 더 표현력 있고 제어 가능한 화자 제스처를 구현함을 보여줍니다.

Yongkang Cheng, Mingjiang Liang, Shaoli Huang, Gaoge Han, Jifeng Ning, Wei Liu2026-03-10💻 cs