Phys-3D: Physics-Constrained Real-Time Crowd Tracking and Counting on Railway Platforms

이 논문은 기차에 장착된 단일 카메라를 통해 플랫폼의 혼잡한 군중을 실시간으로 추적하고 계수하기 위해, 물리 법칙을 기반으로 한 3D 운동 추론과 검출 및 외관 정보를 통합한 'Phys-3D' 프레임워크를 제안하여 기존 방법의 한계를 극복하고 높은 정확도를 달성함을 보여줍니다.

Bin Zeng, Johannes Künzel, Anna Hilsmann + 1 more2026-02-27💻 cs

ColoDiff: Integrating Dynamic Consistency With Content Awareness for Colonoscopy Video Generation

이 논문은 불규칙한 장 구조와 다양한 임상 속성 제어의 어려움을 극복하고 데이터 부족을 해결하기 위해 시간적 일관성과 내용 인식을 통합한 'ColoDiff'라는 확산 기반 프레임워크를 제안하여 고품질의 대장내시경 영상을 생성하고 진단 등 하류 작업을 지원함을 보여줍니다.

Junhu Fu, Shuyu Liang, Wutong Li + 9 more2026-02-27🤖 cs.AI

Plug-and-Play Diffusion Meets ADMM: Dual-Variable Coupling for Robust Medical Image Reconstruction

이 논문은 기존 플러그 앤 플레이 확산 모델 기반의 의료 영상 재구성에서 발생하는 편향과 환각 문제를 해결하기 위해, 적분 피드백을 제공하는 이중 변수 결합 기법과 구조화된 잔여 노이즈를 통계적으로 정합된 가우스 노이즈로 변환하는 스펙트럼 동질화 기법을 제안하여, 편향과 환각의 트레이드오프를 극복하고 정밀한 재구성을 가능하게 합니다.

Chenhe Du, Xuanyu Tian, Qing Wu + 4 more2026-02-27⚡ eess

UniScale: Unified Scale-Aware 3D Reconstruction for Multi-View Understanding via Prior Injection for Robotic Perception

이 논문은 사전 지식을 모듈식으로 통합하여 카메라 내부 파라미터와 외부 파라미터, 깊이 및 포인트 맵, 그리고 장면의 절대 크기를 단일 네트워크로 추정함으로써 로봇 비전 응용을 위한 강력하고 확장 가능한 3D 재구성 프레임워크인 'UniScale'을 제안합니다.

Mohammad Mahdavian, Gordon Tan, Binbin Xu + 3 more2026-02-27💻 cs

Large Multimodal Models as General In-Context Classifiers

이 논문은 대규모 멀티모달 모델 (LMM) 이 제로샷 성능은 CLIP 기반 모델보다 낮을지라도 소수의 컨텍스트 예시를 활용하면 분류 성능을 크게 향상시킬 수 있음을 입증하고, 개방형 세계 설정에서 컨텍스트 정보의 불완전성을 해결하기 위해 제안된 훈련 없는 CIRCLE 방법을 통해 LMM 이 범용 분류기로서의 잠재력을 보여준다고 주장합니다.

Marco Garosi, Matteo Farina, Alessandro Conti + 2 more2026-02-27💻 cs

Decomposing Private Image Generation via Coarse-to-Fine Wavelet Modeling

이 논문은 민감한 이미지의 저주파 성분에만 차분 프라이버시 (DP) 를 적용하고 고주파 세부 사항은 공개된 모델로 보강하는 '거칠게부터 정밀하게' 웨이블릿 모델링 프레임워크를 제안하여, 차분 프라이버시 하에서도 이미지 품질을 크게 향상시킨다는 점을 설명합니다.

Jasmine Bayrooti, Weiwei Kong, Natalia Ponomareva + 3 more2026-02-27💻 cs

LineGraph2Road: Structural Graph Reasoning on Line Graphs for Road Network Extraction

이 논문은 위성 영상에서 도로를 추출하기 위해 키포인트 기반의 희소 유클리드 그래프를 구성하고 이를 선 그래프 (line graph) 로 변환하여 그래프 트랜스포머를 적용함으로써 장거리 의존성과 복잡한 위상 구조를 효과적으로 포착하는 'LineGraph2Road' 프레임워크를 제안합니다.

Zhengyang Wei, Renzhi Jing, Yiyi He + 1 more2026-02-27💻 cs

PGVMS: A Prompt-Guided Unified Framework for Virtual Multiplex IHC Staining with Pathological Semantic Learning

이 논문은 H&E 이미지를 다양한 IHC 염색으로 변환하는 가상 멀티플렉스 염색의 한계를 해결하기 위해, 병리학적 시각 언어 모델을 활용한 적응형 프롬프트 유도, 단백질 인식 학습 전략 (PALS), 그리고 프로토타입 일관성 학습 전략 (PCLS) 을 통합한 PGVMS 라는 새로운 프레임워크를 제안합니다.

Fuqiang Chen, Ranran Zhang, Wanming Hu + 6 more2026-02-27💻 cs

ManifoldGD: Training-Free Hierarchical Manifold Guidance for Diffusion-Based Dataset Distillation

이 논문은 사전 학습된 생성 모델을 활용하여 대규모 데이터셋을 효율적으로 압축하는 'ManifoldGD'를 제안하며, 계층적 군집화를 통해 추출된 IPC 중심점들의 국소 다양체 (manifold) 상에 생성 경로를 투영함으로써 모델 재학습 없이도 기존 방법들보다 우수한 다양성, 충실도 및 분류 정확도를 달성함을 보여줍니다.

Ayush Roy, Wei-Yang Alex Lee, Rudrasis Chakraborty + 1 more2026-02-27🤖 cs.LG

Retrieve and Segment: Are a Few Examples Enough to Bridge the Supervision Gap in Open-Vocabulary Segmentation?

이 논문은 텍스트 프롬프트에 픽셀 주석이 달린 소수의 지원 이미지를 결합하고, 텍스트와 시각적 특징을 융합하는 학습 기반 검색 증강 어댑터를 도입하여, 개방 어휘 분할의 제로샷 성능과 완전 지도 학습 간의 격차를 획기적으로 줄이는 새로운 Few-shot 설정을 제안합니다.

Tilemachos Aravanis, Vladan Stojnić, Bill Psomas + 2 more2026-02-27💻 cs