PDD: Manifold-Prior Diverse Distillation for Medical Anomaly Detection

이 논문은 의료 영상 이상 탐지의 어려움을 해결하기 위해 VMamba 와 Wide-ResNet 의 이원적 사전 지식을 매니폴드 차원에서 통합하고 이를 상보적인 두 개의 학생 모델로 증류하는 'PDD' 프레임워크를 제안하여 기존 최첨단 방법들을 크게 능가하는 성능을 달성했다고 요약할 수 있습니다.

Xijun Lu, Hongying Liu, Fanhua Shang, Yanming Hui, Liang Wan2026-03-10💻 cs

CanoVerse: 3D Object Scalable Canonicalization and Dataset for Generation and Pose

이 논문은 32 만 개의 3D 객체로 구성된 대규모 정규화 (canonicalization) 데이터셋 'CanoVerse'와 이를 자동화하는 프레임워크를 제안하여, 3D 생성의 안정성 향상, 정밀한 3D 형상 검색, 그리고 제로샷 포인트 클라우드 방향 추정 등 다양한 3D 학습 태스크의 성능을 획기적으로 개선합니다.

Li Jin, Yuchen Yang, Weikai Chen, Yujie Wang, Dehao Hao, Tanghui Jia, Yingda Yin, Zeyu Hu, Runze Zhang, Keyang Luo, Li Yuan, Long Quan, Xin Wang, Xueying Qin2026-03-10💻 cs

LiveWorld: Simulating Out-of-Sight Dynamics in Generative Video World Models

이 논문은 시야 밖의 객체 상태가 고정되는 기존 생성형 비디오 월드 모델의 한계를 해결하기 위해, 관찰되지 않는 동안에도 객체가 진화하는 지속 가능한 글로벌 상태를 모델링하는 'LiveWorld' 프레임워크와 이를 평가하는 'LiveBench' 벤치마크를 제안합니다.

Zicheng Duan, Jiatong Xia, Zeyu Zhang, Wenbo Zhang, Gengze Zhou, Chenhui Gou, Yefei He, Feng Chen, Xinyu Zhang, Lingqiao Liu2026-03-10💻 cs

PromptGate Client Adaptive Vision Language Gating for Open Set Federated Active Learning

이 논문은 환자 데이터 공유 없이 의료 AI 의 사생활을 보호하면서 오픈셋 환경에서의 노이즈를 효과적으로 제거하기 위해, 지역적 임상 도메인에 적응하는 가중치 공유 기반의 프롬프트 최적화를 통해 동적 VLM 게이트를 구축하는 'PromptGate' 프레임워크를 제안합니다.

Adea Nesturi, David Dueñas Gaviria, Jiajun Zeng, Shadi Albarqouni2026-03-10💻 cs

ACD-U: Asymmetric co-teaching with machine unlearning for robust learning with noisy labels

이 논문은 서로 다른 아키텍처 (CLIP 기반 비전 트랜스포머와 CNN) 를 활용한 비대칭 공동 교수법과 기계적 망각 기법을 결합하여, 노이즈가 있는 레이블 환경에서 샘플 선택 오류를 사후에 수정하고 확인 편향을 완화함으로써 기존 방법론보다 우수한 성능을 달성하는 ACD-U 프레임워크를 제안합니다.

Reo Fukunaga, Soh Yoshida, Mitsuji Muneyasu2026-03-10💻 cs

Class Visualizations and Activation Atlases for Enhancing Interpretability in Deep Learning-Based Computational Pathology

이 논문은 트랜스포머 기반 계산 병리학 모델의 해석 가능성을 높이기 위해 클래스 시각화와 활성화 지도를 체계적으로 평가하여, 조직 분류에서는 일관된 형태학적 개념을 포착하지만 세부 암 아종 분류에서는 내재적 병리학적 복잡성으로 인해 전문가 간 합의가 낮아지는 한계를 규명했습니다.

Marco Gustav, Fabian Wolf, Christina Glasner, Nic G. Reitsam, Stefan Schulz, Kira Aschenbroich, Bruno Märkl, Sebastian Foersch, Jakob Nikolas Kather2026-03-10💻 cs

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

이 논문은 분류 모델이 예측 시 소수의 지배적인 매개변수에 의존하는 취약성을 해결하기 위해, 훈련 과정에서 과도한 매개변수 기여도를 보정하여 더 넓은 범위의 매개변수를 활용하도록 유도하는 '매개변수 기여 패턴 형성 (SPCP)' 방법을 제안함으로써 분포 외 (OOD) 데이터 탐지 성능을 향상시킵니다.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

이 논문은 배경 문맥에 의존하지 않는 강건한 객체 표현을 학습하기 위해 구조적 사전 지식을 활용한 비대칭 증류와 시공간적 일관성 제약을 도입한 VINO(비문맥 객체를 위한 비디오 기반 불변성) 프레임워크를 제안하며, 이를 통해 밀집 비디오 데이터에서 객체 중심의 특징을 효과적으로 분리해내는 것을 보여줍니다.

Seul-Ki Yeom, Marcel Simon, Eunbin Lee, Tae-Ho Kim2026-03-10💻 cs

PresentBench: A Fine-Grained Rubric-Based Benchmark for Slide Generation

이 논문은 슬라이드 생성 모델의 성능을 정밀하게 평가하기 위해 배경 자료와 238 개의 인스턴스, 그리고 각 인스턴스당 약 54 개의 세부 체크리스트를 포함한 'PresentBench'라는 새로운 벤치마크를 제안하고, 이를 통해 기존 방법보다 인간 선호도와 높은 정합성을 보이며 NotebookLM 이 다른 방법들보다 우수함을 입증했습니다.

Xin-Sheng Chen, Jiayu Zhu, Pei-lin Li, Hanzheng Wang, Shuojin Yang, Meng-Hao Guo2026-03-10💻 cs

Virtual Try-On for Cultural Clothing: A Benchmarking Study

이 논문은 서양식 의류에 치중된 기존 벤치마크의 한계를 극복하기 위해 방글라데시 전통 의상 (사리, 판자니, 살와르 카메즈) 을 포함한 BD-VITON 데이터셋을 구축하고, 이를 기반으로 다양한 가상 의류 착용 모델들의 성능을 평가하고 개선점을 제시합니다.

Muhammad Tausif Ul Islam, Shahir Awlad, Sameen Yeaser Adib, Md. Atiqur Rahman, Sabbir Ahmed, Md. Hasanul Kabir2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

이 논문은 1,000 종 이상의 조류에 대한 이미지, 오디오, 텍스트 데이터를 통합한 대규모 데이터셋과 벤치마크를 구축하여, 조류 종별 정밀 이해와 다중 모달 질문 응답을 수행하는 최첨단 오픈소스 멀티모달 대화형 어시스턴트 'MAviS-Chat'을 제안합니다.

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs