MOO: A Multi-view Oriented Observations Dataset for Viewpoint Analysis in Cattle Re-Identification

이 논문은 다양한 시점에서의 소 재식별 (ReID) 문제를 해결하기 위해 128 개의 균일한 시점에서 촬영된 1,000 마리 소의 대규모 합성 데이터셋 'MOO'를 제안하고, 이를 통해 고도 변화가 모델 성능에 미치는 영향을 정량화하여 실제 응용 분야에서의 성능 향상을 입증했습니다.

William Grolleau, Achraf Chaouch, Astrid Sabourin + 2 more2026-03-05🤖 cs.AI

SPRINT: Semi-supervised Prototypical Representation for Few-Shot Class-Incremental Tabular Learning

이 논문은 기존 비전 기반 방법의 한계를 극복하고, 신뢰도 기반 의사레이블링과 낮은 저장 비용의 특성을 활용한 'SPRINT'이라는 새로운 프레임워크를 제안하여 표본 데이터의 소량 학습과 지평적 학습을 동시에 해결하고 다양한 도메인에서 최첨단 성능을 달성했습니다.

Umid Suleymanov, Murat Kantarcioglu, Kevin S Chan + 6 more2026-03-05🤖 cs.AI

Scalable Evaluation of the Realism of Synthetic Environmental Augmentations in Images

이 논문은 생성형 AI 기반 이미지 편집 기술이 규칙 기반 방법보다 안개, 비, 눈, 야간과 같은 환경 조건을 더 현실적으로 시뮬레이션하여 AI 시스템 평가를 위한 확장 가능한 데이터 생성을 가능하게 한다는 것을 시각 언어 모델 심의와 분포 기반 분석을 통해 입증했습니다.

Damian J. Ruck, Paul Vautravers, Oliver Chalkley + 1 more2026-03-05🤖 cs.LG

ArtHOI: Articulated Human-Object Interaction Synthesis by 4D Reconstruction from Video Priors

이 논문은 3D/4D 지도 없이 단일 영상 사전지식만으로 물리적으로 타당한 인체 - 물체 상호작용을 생성하는 최초의 제로샷 프레임워크인 ArtHOI 를 제안하며, 광학 흐름 기반 부분 분할과 해체된 재구성 파이프라인을 통해 4D 재구성을 수행하여 기존 방법들의 한계를 극복합니다.

Zihao Huang, Tianqi Liu, Zhaoxi Chen + 7 more2026-03-05💻 cs

RANGER: Sparsely-Gated Mixture-of-Experts with Adaptive Retrieval Re-ranking for Pathology Report Generation

이 논문은 전체 슬라이드 이미지의 거대 규모와 복잡한 형태학적 이질성으로 인해 기존 접근법의 한계가 있었던 병리 보고서 생성을 개선하기 위해, 동적 전문가 분업과 적응형 검색 재순위화를 통해 노이즈를 줄이고 의미적 정렬을 강화하는 RANGER 모델을 제안하고 PathText-BRCA 데이터셋에서 우수한 성능을 입증했습니다.

Yixin Chen, Ziyu Su, Hikmat Khan + 1 more2026-03-05🤖 cs.AI

FocusGraph: Graph-Structured Frame Selection for Embodied Long Video Question Answering

이 논문은 긴 시점 중심 비디오의 질문 응답을 위해 저해상도 프레임 순서 대신 장면 캡션 기반 그래프 구조를 활용해 관련 클립을 선택하고, 이를 통해 추론 시간을 단축하면서 FindingDory 및 HourVideo 벤치마크에서 최첨단 성능을 달성하는 'FocusGraph' 프레임워크를 제안합니다.

Tatiana Zemskova, Solomon Andryushenko, Ilya Obrubov + 4 more2026-03-05💻 cs

Leveraging Foundation Models for Content-Based Image Retrieval in Radiology

이 논문은 160 만 개의 2 차원 방사선 영상 데이터셋을 기반으로 비전 파운데이션 모델 (특히 BiomedCLIP) 이 추가 학습 없이도 방사선학 분야에서 전문화된 콘텐츠 기반 이미지 검색 (CBIR) 시스템과 견줄 만한 성능을 발휘할 수 있음을 입증하여, 범용적이고 유연한 의료 이미지 검색 시스템의 가능성을 제시했습니다.

Stefan Denner, David Zimmerer, Dimitrios Bounias + 8 more2026-03-04💻 cs

Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes

이 논문은 컴퓨터 비전 및 그래픽스 분야에서 신경 암시적 함수 연구의 한계를 극복하기 위해 2D 이미지와 3D 장면을 포괄하는 대규모 데이터셋 'Implicit-Zoo'를 소개하고, 이를 통해 토큰 위치 학습 및 3D 카메라 자세 추정 등 다양한 작업의 성능을 향상시키는 새로운 연구 방향을 제시합니다.

Qi Ma, Danda Pani Paudel, Ender Konukoglu + 1 more2026-03-04💻 cs