GeodesicNVS: Probability Density Geodesic Flow Matching for Novel View Synthesis

이 논문은 사전 훈련된 확산 모델의 확률 밀도 기반 측지선을 활용하여 데이터 간 결정론적 변환을 학습하는 'Probability Density Geodesic Flow Matching'을 제안함으로써, 기존 확산 기반 방법들의 한계를 극복하고 시점 간 일관성과 기하학적 정합성이 뛰어난 새로운 뷰 합성을 가능하게 합니다.

Xuqin Wang, Tao Wu, Yanfeng Zhang + 5 more2026-03-03💻 cs

RaUF: Learning the Spatial Uncertainty Field of Radar

이 논문은 레이다의 물리적 특성을 기반으로 이방성 확률 모델과 양방향 도메인 어텐션 메커니즘을 도입하여 공간적 불확실성 필드를 학습하고, 모호한 특징-레이블 매핑 문제를 해결하며 잡음을 억제함으로써 저조도 기상 조건에서도 신뢰할 수 있는 공간 감지 및 보정된 불확실성을 제공하는 'RaUF' 프레임워크를 제안합니다.

Shengpeng Wang, Kuangyu Wang, Wei Wang2026-03-03💻 cs

Content-Aware Frequency Encoding for Implicit Neural Representations with Fourier-Chebyshev Features

이 논문은 기존 INR 의 주파수 편향을 해결하기 위해 Fourier-체비셰프 특징을 활용하여 작업 관련 주파수를 효율적으로 선택하고 넓은 주파수 대역을 합성하는 '콘텐츠 인식 주파수 인코딩 (CAFE)' 및 그 확장 버전인 CAFE+ 를 제안하고, 다양한 벤치마크를 통해 기존 방법보다 우수한 성능을 입증합니다.

Junbo Ke, Yangyang Xu, You-Wei Wen + 1 more2026-03-03🤖 cs.AI

MM-DeepResearch: A Simple and Effective Multimodal Agentic Search Baseline

이 논문은 검색 집중형 멀티모달 QA 데이터 부족, 효과적인 검색 궤적 부재, 온라인 API 비용 문제라는 세 가지 과제를 해결하기 위해 하이퍼그래프 기반 데이터 생성, 도구별 전문가 최적화 및 트리 탐색을 통한 궤적 재구성, 오프라인 검색 엔진 구축이라는 세 가지 전략을 통해 강력한 멀티모달 심층 연구 에이전트 'MM-DeepResearch'를 제안합니다.

Huanjin Yao, Qixiang Yin, Min Yang + 5 more2026-03-03🤖 cs.AI

Differential privacy representation geometry for medical image analysis

이 논문은 의료 영상 분석에서 차분 프라이버시 (DP) 가 성능 저하를 일으키는 메커니즘을 명확히 규명하기 위해, 표현 공간의 기하학적 변위와 작업 헤드의 활용도 차이를 분석하는 새로운 프레임워크인 DP-RGMI 를 제안하고 이를 통해 DP 가 특징을 균일하게 붕괴시키는 것이 아니라 표현의 이방성을 변화시킨다는 사실을 입증했습니다.

Soroosh Tayebi Arasteh, Marziyeh Mohammadi, Sven Nebelung + 1 more2026-03-03🤖 cs.LG

Egocentric Co-Pilot: Web-Native Smart-Glasses Agents for Assistive Egocentric AI

이 논문은 스마트 안경용 웹 네이티브 신경-상징 프레임워크인 'Egocentric Co-Pilot'을 제안하여, 시계열 추론과 계층적 컨텍스트 압축을 통해 장기간의 1 인칭 비디오 기반 질문 답변 및 의사결정을 지원하고, 실시간 스트리밍 파이프라인을 통해 시각 장애 및 인지 과부하 사용자를 위한 접근성 있는 보조 AI 의 실현 가능성을 입증했습니다.

Sicheng Yang, Yukai Huang, Weitong Cai + 8 more2026-03-03🤖 cs.AI

GroundedSurg: A Multi-Procedure Benchmark for Language-Conditioned Surgical Tool Segmentation

이 논문은 수술 중 특정 도구 인스턴스를 언어로 지칭하여 위치를 파악하는 임상적 요구를 충족시키기 위해, 다양한 수술 유형과 조건을 포괄하는 최초의 언어 기반 수술 도구 분할 벤치마크인 'GroundedSurg'를 제안하고 이를 통해 기존 비전 - 언어 모델의 성능 격차와 임상적 추론의 필요성을 입증했습니다.

Tajamul Ashraf, Abrar Ul Riyaz, Wasif Tak + 4 more2026-03-03💻 cs