MMTA: Multi Membership Temporal Attention for Fine-Grained Stroke Rehabilitation Assessment

이 논문은 뇌졸중 재활 평가의 정밀도를 높이기 위해 단일 레이어 내에서 각 프레임이 여러 시간적 윈도우에 동시 주의를 기울이는 '다중 소속 시간적 주의 (MMTA)' 메커니즘을 도입하여, 기존 모델의 한계를 극복하고 비디오 및 IMU 데이터에서 미세한 운동 분할 성능을 향상시킨 단일 단계 아키텍처를 제안합니다.

Halil Ismail Helvaci, Justin Huber, Jihye Bae + 1 more2026-03-03💻 cs

pySpatial: Generating 3D Visual Programs for Zero-Shot Spatial Reasoning

이 논문은 3D 공간 이해가 필요한 작업에서 기존 다중 모달 대규모 언어 모델의 한계를 극복하기 위해, 3D 재구성 및 카메라 포즈 복구 등 공간 도구를 Python 코드 생성을 통해 호출하는 제로샷 시각 프로그래밍 프레임워크 'pySpatial'을 제안하고, 이를 통해 MindCube 및 Omni3D-Bench 벤치마크와 실제 실내 항법 실험에서 뛰어난 성능을 입증했습니다.

Zhanpeng Luo, Ce Zhang, Silong Yong + 6 more2026-03-03💻 cs

VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection

이 논문은 정밀한 센서 보정 없이도 다중 뷰 실내 3D 객체 감지를 가능하게 하기 위해 VGGT 의 내부 시맨틱 및 기하학적 사전 지식을 활용하는 새로운 프레임워크 'VGGT-Det'을 제안하며, 주시 기반 쿼리 생성과 쿼리 주도 특징 집계 모듈을 통해 기존 최첨단 방법보다 ScanNet 과 ARKitScenes 데이터셋에서 성능을 크게 향상시킵니다.

Yang Cao, Feize Wu, Dave Zhenyu Chen + 3 more2026-03-03💻 cs

Seeing Beyond 8bits: Subjective and Objective Quality Assessment of HDR-UGC Videos

이 논문은 HDR-UGC 비디오의 품질 평가를 위해 대규모 주관적 데이터셋 'Beyond8Bits'를 구축하고, HDR 인지 비전 인코더와 강화학습 기반의 HAPO 프레임워크를 도입한 최초의 멀티모달 대형 언어 모델 'HDR-Q'를 제안하여 기존 SDR 모델의 한계를 극복하고 최첨단 성능을 달성했습니다.

Shreshth Saini, Bowen Chen, Neil Birkbeck + 3 more2026-03-03🤖 cs.AI

When Does Margin Clamping Affect Training Variance? Dataset-Dependent Effects in Contrastive Forward-Forward Learning

이 논문은 대비적 포워드-포워드 학습에서 양의 쌍 마진 적용 방식인 클램핑이 CIFAR-10 과 같은 특정 데이터셋에서 학습 분산을 크게 증가시키는 원인을 규명하고, 이를 그라디언트 중립적인 뺄셈 방식으로 대체함으로써 평균 정확도 손실 없이 분산 문제를 해결할 수 있음을 보여줍니다.

Joshua Steier2026-03-03🤖 cs.LG

EraseAnything++: Enabling Concept Erasure in Rectified Flow Transformers Leveraging Multi-Object Optimization

이 논문은 플로우 매칭 기반의 차세대 이미지 및 비디오 생성 모델에서 원하지 않는 개념을 효과적으로 제거하면서도 생성 품질과 시간적 일관성을 유지하기 위해, 제약 조건이 있는 다목적 최적화와 효율적인 그라디언트 수술 기법을 통합한 'EraseAnything++' 프레임워크를 제안합니다.

Zhaoxin Fan, Nanxiang Jiang, Daiheng Gao + 2 more2026-03-03🤖 cs.AI

Fake It Right: Injecting Anatomical Logic into Synthetic Supervised Pre-training for Medical Segmentation

이 논문은 3D 의료 분할을 위해 무한한 확장성을 가진 합성 데이터의 이점과 실제 해부학적 구조의 충실도를 결합하여, 단순한 기하학적 도형 대신 탈식별된 마스크와 위상적 제약을 활용한 '해부학적 논리가 반영된 합성 지도 전학습' 프레임워크를 제안하고, 이를 통해 기존 자기지도학습 및 합성 학습 방법보다 우수한 성능을 입증했습니다.

Jiaqi Tang, Mengyan Zheng, Shu Zhang + 2 more2026-03-03💻 cs

The Texture-Shape Dilemma: Boundary-Safe Synthetic Generation for 3D Medical Transformers

이 논문은 의료 이미지 분석에서 ViT 의 데이터 부족 문제를 해결하기 위해 기존 FDSL 의 한계를 극복하고, 경계 왜곡을 방지하면서 물리 기반의 텍스처를 합성하는 '물리 기반 공간 분리 합성' 프레임워크를 제안하여 BTCV 와 MSD 데이터셋에서 기존 방법보다 우수한 성능을 입증합니다.

Jiaqi Tang, Weixuan Xu, Shu Zhang + 2 more2026-03-03💻 cs