Weakly Supervised Cloud Detection Combining Spectral Features and Multi-Scale Deep Network

이 논문은 얇은 구름의 특징 부족과 훈련 데이터의 한계를 극복하기 위해 스펙트럼 특징과 다중 스케일 장면 수준의 심층 네트워크를 결합한 약지도 구름 탐지 방법 (SpecMCD) 을 제안하여, 다양한 구름 밀도 조건에서 기존 방법보다 7.82% 이상 향상된 F1 점수를 달성한 pixel-level 구름 마스크를 생성함을 보여줍니다.

Shaocong Zhu, Zhiwei Li, Xinghua Li + 1 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

이 논문은 기존 자기지도 학습 방식의 새로운 뷰 합성 모델들이 전이성이 부족하다는 문제를 지적하고, 3D 기하학적 인덕티브 바이어스나 SE(3) 와 같은 명시적 포즈 파라미터화 없이도 입력과 출력의 증강을 통해 카메라 포즈와 장면 내용을 분리하여 진정한 전이 가능한 새로운 뷰 합성을 실현한 'XFactor' 모델을 제안합니다.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

Text-to-3D by Stitching a Multi-view Reconstruction Network to a Video Generator

이 논문은 사전 훈련된 텍스트 - 비디오 생성 모델과 3D 재구성 네트워크를 모델 스티칭 (model stitching) 과 직접 보상 미세 조정 (direct reward finetuning) 기법을 통해 결합하여, 기존 방법보다 우수한 품질의 텍스트 -3D 및 텍스트 - 포인트맵 생성을 가능하게 하는 VIST3A 프레임워크를 제안합니다.

Hyojun Go, Dominik Narnhofer, Goutam Bhat + 3 more2026-03-06💻 cs

DRBD-Mamba for Robust and Efficient Brain Tumor Segmentation with Analytical Insights

이 논문은 뇌 종양 이질성으로 인한 분할의 어려움을 해결하기 위해 공간 locality 를 보존하는 공간 채움 곡선과 게이트 퓨전 모듈을 활용한 DRBD-Mamba 모델을 제안하고, BraTS2023 데이터셋에 대한 체계적인 평가와 분석을 통해 기존 최첨단 방법 대비 분할 정확도 향상과 15 배의 효율성 개선을 입증합니다.

Danish Ali, Ajmal Mian, Naveed Akhtar + 1 more2026-03-06💻 cs

FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

이 논문은 장기간 비디오 이해를 위한 대규모 멀티모달 모델의 확장성 문제를 해결하기 위해, 훈련 없이 모델과 쿼리에 구애받지 않고 시설 위치 함수와 지연 탐욕 알고리즘을 활용하여 효율적으로 시각 토큰을 압축하는 새로운 프레임워크인 FLoC 를 제안합니다.

Janghoon Cho, Jungsoo Lee, Munawar Hayat + 3 more2026-03-06💻 cs

SASG-DA: Sparse-Aware Semantic-Guided Diffusion Augmentation For Myoelectric Gesture Recognition

이 논문은 sEMG 기반 제스처 인식의 과적합 및 일반화 문제를 해결하기 위해, 의미적 표현을 활용한 생성 조건과 희소성 인식 샘플링 전략을 결합하여 충실하고 다양한 증강 데이터를 생성하는 'SASG-DA'라는 새로운 확산 기반 데이터 증강 방법을 제안하고 그 유효성을 입증합니다.

Chen Liu, Can Han, Weishi Xu + 2 more2026-03-06💻 cs

CCSD: Cross-Modal Compositional Self-Distillation for Robust Brain Tumor Segmentation with Missing Modalities

이 논문은 실제 임상 환경에서 흔히 발생하는 MRI 모달리티 결손 문제를 해결하기 위해, 계층적 자기 증류와 점진적 모달리티 조합 증류 전략을 도입한 교차 모달 구성 자기 증류 (CCSD) 프레임워크를 제안하여 뇌종양 분할의 성능과 일반화 능력을 크게 향상시켰음을 보여줍니다.

Dongqing Xie, Yonghuang Wu, Zisheng Ai + 4 more2026-03-06💻 cs

Revisiting Multimodal KV Cache Compression: A Frequency-Domain-Guided Outlier-KV-Aware Approach

이 논문은 멀티모달 KV 캐시의 주파수 영역 에너지 분포와 이상치 (Outlier) KV 를 분석하여, 기존 방법의 한계를 극복하고 FlashAttention 과 호환되면서도 메모리 사용량을 80% 줄이고 디코딩 속도를 1.69 배 향상시키는 'FlashCache'라는 새로운 압축 프레임워크를 제안합니다.

Yaoxin Yang, Peng Ye, Xudong Tan + 4 more2026-03-06💻 cs