Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

이 논문은 2D 투영 기반의 다단계 접근법을 통해 3D 해부학적 구조를 추정하고 이를 활용하여 경추 골절을 자동으로 식별하는 효율적인 파이프라인을 제안하며, 이는 전문 방사선사의 진단 수준에 준하는 성능을 달성하면서도 중간 처리 단계의 차원을 축소하여 임상 적용 가능성을 입증했습니다.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges

본 논문은 보행 시 발바닥 압력 패턴을 기반으로 한 생체 인식 기술의 발전과 남은 과제를 논의하기 위해 UNB StepUP-P150 데이터셋을 활용한 '제1 회 국제 StepUP 보행 생체 인식 대회'의 방법론, 23 개 팀의 참여 결과, 그리고 최우수 팀의 성능과 일반화 한계 등을 종합적으로 보고합니다.

Robyn Larracy, Eve MacDonald, Angkoon Phinyomark + 5 more2026-03-05🤖 cs.LG

VidEoMT: Your ViT is Secretly Also a Video Segmentation Model

이 논문은 복잡한 추적 모듈 없이 ViT 인코더만으로도 실시간 비디오 분할이 가능하도록, 이전 프레임의 쿼리를 재사용하고 새로운 쿼리와 융합하는 경량 메커니즘을 도입한 'VidEoMT'를 제안하여 기존 모델 대비 5~10 배 빠른 속도와 경쟁력 있는 정확도를 달성했다고 요약할 수 있습니다.

Narges Norouzi, Idil Esen Zulfikar, Niccolò Cavagnero + 4 more2026-03-05💻 cs

When Safety Collides: Resolving Multi-Category Harmful Conflicts in Text-to-Image Diffusion via Adaptive Safety Guidance

이 논문은 여러 유해 카테고리 간의 충돌로 인해 기존 안전 가이드 방식이 오히려 유해 생성률을 높이는 문제를 해결하기 위해, 생성 단계에서 유해 카테고리를 동적으로 식별하고 해당 카테고리에만 정밀하게 안전 조향을 적용하는 'CASG'라는 훈련 없는 프레임워크를 제안합니다.

Yongli Xiang, Ziming Hong, Zhaoqing Wang + 3 more2026-03-05💻 cs

Skullptor: High Fidelity 3D Head Reconstruction in Seconds with Multi-View Normal Prediction

이 논문은 단안 기초 모델과 교차 뷰 어텐션을 결합한 다중 뷰 표면 법선 예측 모델과 역 렌더링 최적화 프레임워크를 융합하여, 다중 뷰 포토그래메트리 수준의 고품질 3D 얼굴 기하학을 카메라 수와 계산 비용을 획기적으로 줄여 단 몇 초 만에 재구성하는 'Skullptor' 방법을 제안합니다.

Noé Artru, Rukhshanda Hussain, Emeline Got + 3 more2026-03-05💻 cs

Momentum Memory for Knowledge Distillation in Computational Pathology

이 논문은 배치 내 정렬의 한계를 극복하고 유전체 및 조직병리 데이터를 메모리에 축적하여 학습하는 '모멘텀 메모리 지식 증류 (MoMKD)' 프레임워크를 제안함으로써, 유전체 데이터 없이도 조직병리 이미지만으로 정확한 암 진단이 가능하도록 하는 강력한 지식 증류 패러다임을 제시합니다.

Yongxin Guo, Hao Lu, Onur C. Koyun + 3 more2026-03-05💻 cs

Beyond Dominant Patches: Spatial Credit Redistribution For Grounded Vision-Language Models

이 논문은 비전 - 언어 모델의 환각 현상을 유발하는 '공간적 신용 붕괴'를 식별하고, 가중치 수정 없이 추론 시 주시 패치와 그 주변에 시각적 정보를 재분배하여 환각을 획기적으로 줄이면서도 생성 품질과 지연 시간을 최적화하는 '공간적 신용 재분배 (SCR)' 방법을 제안합니다.

Niamul Hassan Samin, Md Arifur Rahman, Abdullah Ibne Hanif Arean + 2 more2026-03-05🤖 cs.AI

EvalMVX: A Unified Benchmarking for Neural 3D Reconstruction under Diverse Multiview Setups

이 논문은 MVS, MVPS, MVSfP 등 다양한 다중 뷰 3D 재구성 기법의 성능을 정량적으로 평가할 수 있도록 25 개의 물체와 8,500 개의 정렬된 이미지 및 정밀한 3D 메쉬를 포함한 'EvalMVX'라는 새로운 벤치마크 데이터셋을 제안하고, 이를 기반으로 최신 13 개 방법을 평가하여 향후 연구 방향을 제시합니다.

Zaiyan Yang, Jieji Ren, Xiangyi Wang + 5 more2026-03-05💻 cs