FDeID-Toolbox: Face De-Identification Toolbox

이 논문은 프라이버시 보호, 유틸리티 보존, 시각적 품질이라는 세 가지 차원에서 다양한 얼굴 비식별화 (FDeID) 방법의 공정한 비교와 재현성을 가능하게 하기 위해 표준화된 데이터 로더, 통합된 방법 구현, 유연한 추론 파이프라인, 체계적인 평가 프로토콜을 갖춘 포괄적인 도구상자 'FDeID-Toolbox'를 제안합니다.

Hui Wei, Hao Yu, Guoying Zhao2026-03-16💻 cs

Perceive What Matters: Relevance-Driven Scheduling for Multimodal Streaming Perception

이 논문은 인간 - 로봇 협업 환경에서 정보의 중복성을 줄이고 계산 자원을 최적화하기 위해 이전 프레임의 출력을 기반으로 필수적인 멀티모달 인식 모듈을 실시간으로 스케줄링하는 경량 프레임워크를 제안하여, 기존 방식 대비 지연 시간을 27.52% 단축하면서도 인식 정확도를 크게 향상시켰음을 보여줍니다.

Dingcheng Huang, Xiaotong Zhang, Kamal Youcef-Toumi2026-03-16💻 cs

Towards Spatio-Temporal World Scene Graph Generation from Monocular Videos

이 논문은 가려짐과 카메라 움직임으로 인해 일시적으로 관찰되지 않는 객체까지 포함하는 시공간적 세계 장면 그래프 생성 (WSGG) 과 이를 위한 4D 데이터셋 (ActionGenome4D) 및 다양한 추론 방법을 제안하여 비디오 장면 이해를 세계 중심적이고 시간적으로 지속 가능한 수준으로 발전시킵니다.

Rohith Peddi, Saurabh, Shravan Shanmugam + 4 more2026-03-16💻 cs

Navig-AI-tion: Navigation by Contextual AI and Spatial Audio

이 논문은 비전 언어 모델 (VLM) 과 방향성 공간 오디오를 결합하여 환경 랜드마크를 기반으로 한 안내와 잘못된 방향을 즉시 교정하는 오디오 신호를 제공함으로써, 기존 오디오 전용 내비게이션 시스템보다 사용자의 경로 이탈을 줄이고 방향 감각을 향상시킨 새로운 보행 내비게이션 시스템의 유효성을 검증했습니다.

Mathias N. Lystbæk, Haley Adams, Ranjith Kagathi Ananda + 6 more2026-03-16💻 cs

Adaptive aggregation of Monte Carlo augmented decomposed filters for efficient group-equivariant convolutional neural network

이 논문은 파라미터 공유의 계산적 부담을 해결하기 위해 몬테카를로 샘플링과 부트스트랩 리샘플링을 활용한 확률적 분해 필터의 적응적 집합을 제안함으로써, 그룹 공변성 신경망의 효율성을 높이고 표준 CNN 의 성능을 향상시키는 방법을 제시합니다.

Wenzhao Zhao, Barbara D. Wichtmann, Steffen Albert + 3 more2026-03-13💻 cs

Positionality in Σ_0^2 and a completeness result

이 논문은 무한 게임에서 전치 독립적이고 중립 문자를 갖는 Σ02\Sigma_0^2 계층의 위치성 전략 존재 조건을 역사 결정적 단조 코-뷔치 오토마타와 연결하여 일반화하고, 이를 통해 평균 보상 (mean-payoff) 목표의 위치성을 증명하며 유한 게임에서 위치적인 임의의 목표가 무한 게임에서도 위치적인 동등 목표를 가진다는 완전성 결과를 제시합니다.

Pierre Ohlmann, Michał Skrzypczak2026-03-13💻 cs