Structure-Guided Histopathology Synthesis via Dual-LoRA Diffusion

이 논문은 국소 구조 복원과 전역 구조 합성을 단일 모델에서 통합적으로 수행하기 위해 다중 클래스 핵 중심점을 공간적 사전 지식으로 활용하고 두 가지 작업별 LoRA 어댑터를 공유 백본에 적용한 '듀얼-LoRA 제어 확산 (Dual-LoRA Controllable Diffusion)' 프레임워크를 제안하며, 이를 통해 기존 방법 대비 조직의 구조적 충실도와 현실성을 크게 향상시켰음을 보여줍니다.

Xuan Xu, Prateek Prasanna2026-03-06💻 cs

Mask-aware inference with State-Space Models

이 논문은 State-Space 모델인 Mamba 아키텍처가 무작위 형태의 결손 데이터를 처리할 수 있도록 '부분 합성 (Partial Convolutions)'의 원리를 도입한 새로운 구성 요소인 '부분 비전 마바 (Partial Vision Mamba, PVM)'를 제안하고, 이를 통해 깊이 완성, 이미지 인페인팅, 결손 데이터 분류 등 다양한 작업에서 효과성을 입증합니다.

Ignasi Mas, Ramon Morros, Javier-Ruiz Hidalgo + 1 more2026-03-06💻 cs

PinPoint: Evaluation of Composed Image Retrieval with Explicit Negatives, Multi-Image Queries, and Paraphrase Testing

이 논문은 단일 정답과 부정적 샘플 부족 등 기존 벤치마크의 한계를 극복하기 위해 다중 정답, 명시적 하드 네거티브, 다양한 문장 재구성 및 다중 이미지 지원을 포함한 포괄적인 CIR 평가 벤치마크 'PinPoint'를 제안하고, 이를 통해 기존 모델의 한계를 분석하며 오프더셸 MLLM 기반의 훈련 없는 재순위화 방법을 제시합니다.

Rohan Mahadev, Joyce Yuan, Patrick Poirson + 3 more2026-03-06💻 cs

Spinverse: Differentiable Physics for Permeability-Aware Microstructure Reconstruction from Diffusion MRI

이 논문은 확산 MRI 신호를 완전히 미분 가능한 Bloch-Torrey 시뮬레이터를 통해 역산하여, 고정된 메쉬 연결성 내에서 학습 가능한 면 투과도 매개변수를 최적화함으로써 세포막 투과성을 고려한 미세구조 인터페이스를 명시적으로 재구성하는 'Spinverse' 방법을 제안합니다.

Prathamesh Pradeep Khole, Mario M. Brenes, Zahra Kais Petiwala + 5 more2026-03-06💻 cs

Are Multimodal LLMs Ready for Surveillance? A Reality Check on Zero-Shot Anomaly Detection in the Wild

이 논문은 멀티모달 대규모 언어 모델 (MLLM) 이 제로샷 설정에서 비디오 이상 탐지 시 높은 정밀도를 보이지만 재현율 (recall) 이 급격히 저하되는 보수적 편향을 가지며, 클래스별 지시어를 통해 성능을 개선할 수 있으나 여전히 실용적 한계가 있음을 규명합니다.

Shanle Yao, Armin Danesh Pazho, Narges Rashvand + 1 more2026-03-06💻 cs

Evaluating GPT-5 as a Multimodal Clinical Reasoner: A Landscape Commentary

이 논문의 초록에 따르면, GPT-5 는 텍스트 기반 추론과 일부 다중모달 임상 추론 능력에서 GPT-4o 를 능가하는 유의미한 진전을 보였으나, 신경방사선학 및 유방촬영과 같은 고도로 전문화된 지각 기반 작업에서는 여전히 전문 목적 모델에 미치지 못해 임상 현장에서의 완전한 대체는 아직 이르다는 결론을 내립니다.

Alexandru Florea, Shansong Wang, Mingzhe Hu + 5 more2026-03-06💻 cs

Evaluating and Correcting Human Annotation Bias in Dynamic Micro-Expression Recognition

이 논문은 문화적 배경에 따른 인간 주석 편향을 줄이고 마이크로표정 인식 성능을 향상시키기 위해, 오프셋 프레임의 불확실성을 해결하는 새로운 전역 반단조 차분 선택 전략 (GAMDSS) 아키텍처를 제안하고 이를 통해 다문화 데이터셋에서 주관적 오류를 효과적으로 감소시켰음을 보여줍니다.

Feng Liu, Bingyu Nan, Xuezhong Qian + 1 more2026-03-06💻 cs

DSA-SRGS: Super-Resolution Gaussian Splatting for Dynamic Sparse-View DSA Reconstruction

이 논문은 희소 뷰 DSA 데이터에서 고해상도 4D 혈관 재구성을 가능하게 하기 위해, 고품질 사전 지식을 통합한 다중 충실도 텍스처 학습 모듈과 신뢰도 기반 전략, 그리고 방사형 서브픽셀 밀도화 기법을 도입한 'DSA-SRGS'라는 초해상도 가우스 스플래팅 프레임워크를 제안합니다.

Shiyu Zhang, Zhicong Wu, Huangxuan Zhao + 7 more2026-03-06💻 cs

RMK RetinaNet: Rotated Multi-Kernel RetinaNet for Robust Oriented Object Detection in Remote Sensing Imagery

이 논문은 원격 탐사 이미지의 회전 객체 검출 문제를 해결하기 위해 다중 스케일 커널 블록, 다방향 컨텍스트 앵커 어텐션 메커니즘, 하향식 경로, 그리고 오일러 각도 인코딩 모듈을 도입하여 RMK RetinaNet 을 제안하고, 다양한 데이터셋에서 우수한 성능과 강건성을 입증합니다.

Huiran Sun2026-03-06💻 cs

LAW & ORDER: Adaptive Spatial Weighting for Medical Diffusion and Segmentation

이 논문은 의료 영상 분석의 공간적 불균형 문제를 해결하기 위해 확산 모델 학습 시 손실 가중치를 적응적으로 조절하는 LAW 와 효율적인 분할을 위한 ORDER 어댑터를 도입하여, 생성 품질과 분할 정확도를 크게 향상시키고 모델 크기를 획기적으로 줄인 'LAW & ORDER' 프레임워크를 제안합니다.

Anugunj Naman, Ayushman Singh, Gaibo Zhang + 1 more2026-03-06💻 cs