DeformTrace: A Deformable State Space Model with Relay Tokens for Temporal Forgery Localization

이 논문은 변형 가능한 상태 공간 모델과 릴레이 토큰 메커니즘을 도입하여 비디오 및 오디오의 조작 구간을 정밀하게 식별하는 새로운 프레임워크인 'DeformTrace'를 제안하며, 기존 방법들의 한계를 극복하고 적은 파라미터로 최첨단 성능을 달성함을 보여줍니다.

Xiaodong Zhu, Suting Wang, Yuanming Zheng + 5 more2026-03-06🤖 cs.AI

Federated Modality-specific Encoders and Partially Personalized Fusion Decoder for Multimodal Brain Tumor Segmentation

이 논문은 다중 모달리티 간 이질성과 개인화 요구를 동시에 해결하기 위해, 각 모달리티별 인코더를 연방 학습하고 부분적으로 개인화된 퓨전 디코더를 도입한 'FedMEPD'라는 새로운 연방 학습 프레임워크를 제안하여 뇌 종양 분할 성능을 향상시킨 연구입니다.

Hong Liu, Dong Wei, Qian Dai + 3 more2026-03-06💻 cs

FC-VFI: Faithful and Consistent Video Frame Interpolation for High-FPS Slow Motion Video Generation

이 논문은 사전 학습된 비디오 확산 모델의 한계를 극복하고 고해상도 고프레임레이트 슬로우 모션 생성을 위해, 잠재 시퀀스의 시간적 모델링과 구조 인식 운동 가이드, 그리고 시간적 일관성 손실을 도입하여 충실도와 일관성을 모두 확보한 새로운 비디오 프레임 보간 방법인 FC-VFI 를 제안합니다.

Ganggui Ding, Hao Chen, Xiaogang Xu2026-03-06💻 cs

Location-Aware Pretraining for Medical Difference Visual Question Answering

이 논문은 방사선과 전문의의 비교 진단 워크플로우를 모방하여 질병 진행과 촬영 차이로 인한 미세한 시각적 변이를 구별하기 위해 자동 참조 표현 및 지상화 캡션링과 같은 위치 인식 태스크를 포함한 사전 학습 프레임워크를 제안함으로써, 흉부 X-ray 이미지에서 임상적으로 관련 있는 변화를 감지하고 추론하는 성능을 획기적으로 개선한 연구입니다.

Denis Musinguzi, Caren Han, Prasenjit Mitra2026-03-06🤖 cs.AI

BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement

이 논문은 저조도 이미지 향상 (LLIE) 시 이벤트 카메라의 내재적 노이즈와 이미지 신호 대 잡음비 저하로 인한 성능 병목 현상을 해결하기 위해, 이미지와 이벤트 간의 강한 기울기 상관관계를 활용한 경향성 기반 이벤트 정제 사전 지식을 도입하고, 향상 작업에 적응적으로 최적화되도록 이벤트 정제를 상하위 레벨 최적화 문제로 재정의한 'BiEvLight' 프레임워크를 제안합니다.

Zishu Yao, Xiang-Xiang Su, Shengning Zhou + 3 more2026-03-06💻 cs

Think, Then Verify: A Hypothesis-Verification Multi-Agent Framework for Long Video Understanding

이 논문은 장기간 비디오 이해의 어려움을 해결하기 위해, 답변 후보를 검증 가능한 가설로 재구성하고 국소적 비디오 콘텐츠를 통해 이를 검증하는 'VideoHV-Agent'라는 다중 에이전트 프레임워크를 제안하여 기존 방법론보다 높은 정확도와 논리적 타당성을 달성했다고 요약할 수 있습니다.

Zheng Wang, Haoran Chen, Haoxuan Qin + 3 more2026-03-06💻 cs

Physics-consistent deep learning for blind aberration recovery in mobile optics

이 논문은 단일 흐릿한 이미지에서 물리적으로 일관된 Zernike 계수, 파면 및 점확산함수 제약을 통합한 'Lens2Zernike' 프레임워크를 제안하여 모바일 광학의 왜곡을 물리적으로 정확하게 복원하고 이를 통해 안정적인 비블라인드 디컨볼루션을 가능하게 함으로써 기존 딥러닝 및 고전적 방법보다 우수한 성능을 달성했습니다.

Kartik Jhawar, Tamo Sancho Miguel Tandoc, Khoo Jun Xuan + 1 more2026-03-06💻 cs