CLAP: Unsupervised 3D Representation Learning for Fusion 3D Perception via Curvature Sampling and Prototype Learning

이 논문은 곡률 샘플링과 학습 가능한 프로토타입을 활용하여 이미지와 점구름의 상호 보완적 특성을 효율적으로 결합한 CLAP 이라는 새로운 비지도 3D 표현 학습 방법을 제안하며, 이를 통해 기존 최첨단 방법 대비 최대 2 배의 성능 향상을 달성함을 보여줍니다.

Runjian Chen, Hang Zhang, Avinash Ravichandran + 4 more2026-03-02💻 cs

JiSAM: Alleviate Labeling Burden and Corner Case Problems in Autonomous Driving via Minimal Real-World Data

이 논문은 시뮬레이션 데이터의 도메인 격차와 샘플 효율성 문제를 해결하기 위해 제안된 'JiSAM' 방법을 통해, 실제 LiDAR 데이터의 2.5% 만으로도 최첨단 3D 객체 탐지 성능을 달성하고 라벨링이 없는 희귀 객체까지 효과적으로 인식할 수 있음을 보여줍니다.

Runjian Chen, Wenqi Shao, Bo Zhang + 3 more2026-03-02💻 cs

What Makes Good Synthetic Training Data for Zero-Shot Stereo Matching?

이 논문은 절차적 데이터 생성기의 매개변수를 체계적으로 분석하여 제로샷 스테레오 매칭 성능을 최적화하는 합성 데이터의 설계 요소를 규명하고, 이를 기반으로 오픈소스로 공개된 고품질 데이터셋을 구축하여 기존 데이터셋 혼합 학습보다 우수한 성능을 달성했음을 보여줍니다.

David Yan, Alexander Raistrick, Jia Deng2026-03-02💻 cs

OmniFall: From Staged Through Synthetic to Wild, A Unified Multi-Domain Dataset for Robust Fall Detection

이 논문은 제한된 기존 데이터셋의 한계를 극복하고 실제 환경으로의 일반화 성능을 검증하기 위해, 80 시간 분량의 15 개 영상과 16 가지 클래스로 구성된 3 가지 영역 (스태지드, 합성, 자연 발생) 을 아우르는 통합 벤치마크 'OmniFall'을 제안합니다.

David Schneider, Zdravko Marinov, Zeyun Zhong + 5 more2026-03-02💻 cs

LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation

이 논문은 LLM 의 지식을 활용하여 텍스트 정보를 강화하고, CLIP 기반의 멀티모달 융합 및 다중 어텐션 메커니즘을 통해 도메인 간 선호도와 복잡한 사용자 관심을 효과적으로 포착함으로써 기존 방법보다 우수한 성능을 보이는 새로운 크로스 도메인 순차 추천 모델인 LLM-EMF 를 제안합니다.

Wangyu Wu, Zhenhong Chen, Wenqiao Zhang + 5 more2026-03-02💻 cs