Leveraging Model Soups to Classify Intangible Cultural Heritage Images from the Mekong Delta

본 논문은 메콩강 삼각주의 무형문화유산 이미지 분류에서 데이터 부족과 높은 시각적 유사성으로 인한 과적합 문제를 해결하기 위해, CoAtNet 아키텍처와 모델 수프 (Model Soups) 기법을 결합하여 분산을 줄이고 일반화 성능을 향상시킨 새로운 프레임워크를 제안하고, ICH-17 데이터셋에서 기존 최첨단 모델들을 능가하는 성능을 입증했습니다.

Quoc-Khang Tran, Minh-Thien Nguyen, Nguyen-Khang Pham2026-03-10🤖 cs.LG

DINOv3 Visual Representations for Blueberry Perception Toward Robotic Harvesting

이 논문은 대규모 자기지도 학습으로 훈련된 비전 기반 모델인 DINOv3 를 블루베리 수확 로봇의 시각 작업에 적용한 결과, 분할 작업에는 효과적이지만 검출 및 군집 인식에는 공간적 구조와 스케일 변이로 인해 한계가 있음을 규명하여, 이를 하류 작업의 공간 모델링과 정합된 의미적 백본으로 활용해야 함을 제시합니다.

Rui-Feng Wang, Daniel Petti, Yue Chen, Changying Li2026-03-10💻 cs

Interpretable Motion-Attentive Maps: Spatio-Temporally Localizing Concepts in Video Diffusion Transformers

이 논문은 Video Diffusion Transformers 가 텍스트 기반 운동 개념을 어떻게 비디오로 변환하는지 이해하기 위해, 그라디언트 계산 없이 운동과 비운동 개념 모두에 대한 시공간적 국소화 맵을 생성하는 새로운 해석 가능한 방법론 (GramCol 및 IMAP) 을 제안합니다.

Youngjun Jun, Seil Kang, Woojung Han, Seong Jae Hwang2026-03-10🤖 cs.LG

CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning

이 논문은 SFT 와 RL 의 시너지를 극대화하고 정책 엔트로피 기반의 동적 조정 및 그라디언트 외과 기법을 도입하여 GUI 에이전트의 지속적인 학습 성능을 향상시키고, 이를 평가하기 위한 AndroidControl-CL 벤치마크를 제안하는 CGL 프레임워크를 소개합니다.

Zhenquan Yao, Zitong Huang, Yihan Zeng, Jianhua Han, Hang Xu, Chun-Mei Feng, Jianwei Ma, Wangmeng Zuo2026-03-10🤖 cs.LG

LDP-Slicing: Local Differential Privacy for Images via Randomized Bit-Plane Slicing

이 논문은 고차원 이미지 데이터에 대한 국소적 차분 프라이버시 (LDP) 의 실용성 문제를 해결하기 위해 픽셀 값을 비트 평면으로 분해하고 지각적 왜곡 및 최적화된 예산 할당을 결합한 경량화 프레임워크 'LDP-Slicing'을 제안하여, 기존 방법보다 뛰어난 유틸리티를 보장하면서도 엄격한 프라이버시를 유지하는 것을 목표로 합니다.

Yuanming Cao, Chengqi Li, Wenbo He2026-03-10💻 cs

Roots Beneath the Cut: Uncovering the Risk of Concept Revival in Pruning-Based Unlearning for Diffusion Models

이 논문은 확산 모델의 프루닝 기반 학습 제거 방식이 제거된 개념의 위치 정보를 누출시켜 데이터나 재학습 없이도 개념을 부활시킬 수 있는 치명적인 취약점이 있음을 발견하고, 이를 방어하기 위한 안전한 프루닝 메커니즘을 제안합니다.

Ci Zhang, Zhaojun Ding, Chence Yang, Jun Liu, Xiaoming Zhai, Shaoyi Huang, Beiwen Li, Xiaolong Ma, Jin Lu, Geng Yuan2026-03-10🤖 cs.LG

Margin-Consistent Deep Subtyping of Invasive Lung Adenocarcinoma via Perturbation Fidelity in Whole-Slide Image Analysis

이 논문은 BMIRDS-LUAD 데이터셋을 기반으로 베이지안 최적화 기반의 교란 충실도 (Perturbation Fidelity) 점수와 마진 일관성 프레임워크를 도입하여 침습성 폐선암의 아형 분류 정확도를 획기적으로 향상시키고 외부 벤치마크에서도 우수한 일반화 성능을 입증한 딥러닝 연구입니다.

Meghdad Sabouri Rad (Vincent), Junze (Vincent), Huang, Mohammad Mehdi Hosseini, Rakesh Choudhary, Saverio J. Carello, Ola El-Zammar, Michel R. Nasr, Bardia Rodd2026-03-10💻 cs

ASMIL: Attention-Stabilized Multiple Instance Learning for Whole Slide Imaging

이 논문은 전체 슬라이드 이미지 진단에서 주의 기반 다중 인스턴스 학습의 불안정성, 과적합, 과도한 집중 문제를 해결하기 위해 앵커 모델과 정규화 시그모이드 함수를 도입한 ASMIL 프레임워크를 제안하고, 이를 통해 기존 방법론보다 성능을 크게 향상시켰음을 보여줍니다.

Linfeng Ye, Shayan Mohajer Hamidi, Zhixiang Chi, Guang Li, Mert Pilanci, Takahiro Ogawa, Miki Haseyama, Konstantinos N. Plataniotis2026-03-10💻 cs