Semantic Class Distribution Learning for Debiasing Semi-Supervised Medical Image Segmentation

이 논문은 의료 이미지 세그멘테이션에서 발생하는 클래스 불균형 문제를 해결하기 위해, 학습 가능한 클래스 프록시와 레이블 데이터를 활용한 양방향 정렬 및 앵커 제약 기법을 통해 특징 분포를 구조화하는 '의미론적 클래스 분포 학습 (SCDL)' 프레임워크를 제안하고, Synapse 및 AMOS 데이터셋에서 소수 클래스를 포함한 전반적인 성능을 획기적으로 향상시킨 결과를 보여줍니다.

Yingxue Su, Yiheng Zhong, Keying Zhu + 5 more2026-03-06💻 cs

Digital Twin Driven Textile Classification and Foreign Object Recognition in Automated Sorting Systems

이 논문은 RGB-D 센서, 촉각 피드백, 충돌 인식 모션 플랜닝을 갖춘 디지털 트윈 기반 양팔 로봇 시스템과 시각 언어 모델 (VLM) 을 통합하여, 변형 가능한 의류와 이물질을 실시간으로 분류 및 식별하는 자동화된 텍스타일 선별 시스템의 실현 가능성을 입증했습니다.

Serkan Ergun, Tobias Mitterer, Hubert Zangl2026-03-06💻 cs

Wiki-R1: Incentivizing Multimodal Reasoning for Knowledge-based VQA via Data and Sampling Curriculum

이 논문은 noisy 한 검색과 체계적인 지식베이스의 특성으로 인해 기존 멀티모달 모델이 지식 기반 시각 질문 답변 (KB-VQA) 에서 겪는 어려움을 해결하기 위해, 데이터 생성과 샘플링 커리큘럼을 통해 추론 능력을 체계적으로 고취시키는 'Wiki-R1' 프레임워크를 제안하고, 이를 통해 Encyclopedic VQA 와 InfoSeek 벤치마크에서 새로운 최첨단 성능을 달성했음을 보여줍니다.

Shan Ning, Longtian Qiu, Xuming He2026-03-06💻 cs

Layer by layer, module by module: Choose both for optimal OOD probing of ViT

이 논문은 사전 학습된 비전 트랜스포머 (ViT) 의 중간 레이어가 분포 변화에 따라 최적의 성능을 내는 위치가 달라지며, 심한 분포 변화 시에는 피드포워드 네트워크 내부 활성화가, 약한 변화 시에는 멀티헤드 셀프 어텐션의 정규화된 출력이 각각 최적의 OOD 탐지 지점임을 규명합니다.

Ambroise Odonnat, Vasilii Feofanov, Laetitia Chapel + 2 more2026-03-06🤖 cs.LG

Fusion4CA: Boosting 3D Object Detection via Comprehensive Image Exploitation

이 논문은 LiDAR 과 RGB 데이터의 융합을 통해 3D 객체 감지 성능을 향상시키기 위해 대비 정렬 모듈, 카메라 보조 분기, 인지 어댑터, 그리고 좌표 어텐션 모듈을 도입한 'Fusion4CA'를 제안하며, nuScenes 및 시뮬레이션 달 환경 실험을 통해 적은 학습 에포크와 파라미터 증가로 기존 베이스라인 대비 1.2%p 의 mAP 개선을 입증했습니다.

Kang Luo, Xin Chen, Yangyi Xiao + 1 more2026-03-06💻 cs