When Memory Becomes a Vulnerability: Towards Multi-turn Jailbreak Attacks against Text-to-Image Generation Systems

이 논문은 텍스트-이미지 생성 시스템의 메모리 메커니즘을 악용하여 기존 단일 프롬프트 공격의 한계를 극복하고, 'Inception'이라는 새로운 멀티턴 재일브랙 공격 기법을 제안하여 안전성 필터를 우회하고 공격 성공률을 크게 향상시켰음을 보여줍니다.

Shiqian Zhao, Jiayang Liu, Yiming Li + 9 more2026-03-05💻 cs

Intelligent Diagnosis Using Dual-Branch Attention Network for Rare Thyroid Carcinoma Recognition with Ultrasound Imaging

이 논문은 초음파 영상의 이질적 형태 특징과 데이터 불균형 문제를 해결하기 위해 효율적인 공간 인코딩과 전역 의미 모델링을 결합한 이중 분기 어텐션 네트워크 (CSASN) 를 제안하여 희귀 갑상선 암의 진단 정확도를 향상시켰음을 보여줍니다.

Peiqi Li, Yincheng Gao, Renxing Li + 10 more2026-03-05💻 cs

Apple's Synthetic Defocus Noise Pattern: Characterization and Forensic Applications

이 논문은 아이폰 포트레이트 모드 이미지의 인공적 심도 외곽 노이즈 패턴 (SDNP) 을 정밀하게 분석하여 그 특성을 규명하고, 이를 PRNU 기반 카메라 소스 검증의 오검출을 줄이는 동시에 이미지 출처 추적 및 포렌식 분석의 정확도를 향상시키는 데 활용하는 방법을 제시합니다.

David Vázquez-Padín, Fernando Pérez-González, Pablo Pérez-Miguélez2026-03-05💻 cs

Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation

이 논문은 안전이 중요한 다중 모달 환경에서 OOD 검출 및 분할을 위해 이론적 근거를 바탕으로 한 매우 간단하고 빠른 'Feature Mixing' 방법론과 새로운 CARLA-OOD 데이터셋을 제안하여 기존 방법 대비 10 배에서 370 배의 속도 향상과 함께 최첨단 성능을 달성함을 보여줍니다.

Moru Liu, Hao Dong, Jessica Kelly + 2 more2026-03-05🤖 cs.AI

BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Digital Behavioural Change

이 논문은 디지털 행동 변화 중 ambivalence(양가성) 와 hesitancy(주저함) 를 자동으로 인식하기 위해 캐나다 300 명으로부터 수집된 1,427 개의 비디오로 구성된 BAH 데이터셋을 소개하고, 이에 대한 벤치마크 실험 결과를 통해 기존 모델의 한계와 향후 다중 모달 및 시공간 모델의 필요성을 제시합니다.

Manuela González-González, Soufiane Belharbi, Muhammad Osama Zeeshan + 6 more2026-03-05🤖 cs.LG

Fast Equivariant Imaging: Acceleration for Unsupervised Learning via Augmented Lagrangian and Auxiliary PnP Denoisers

이 논문은 라그랑주 승수법과 보조 PnP 디노이저를 결합하여 ground-truth 데이터 없이도 X-ray CT 재구성 및 이미지 인페인팅 작업에서 기존 Equivariant Imaging 방법보다 10 배 빠른 학습 속도와 향상된 일반화 성능을 달성하는 'Fast Equivariant Imaging (FEI)' 프레임워크를 제안합니다.

Guixian Xu, Jinglai Li, Junqi Tang2026-03-05🤖 cs.LG

D2Dewarp: Dual Dimensions Geometric Representation Learning Based Document Image Dewarping

이 논문은 문서 이미지의 왜곡을 보정하기 위해 수평 및 수직 방향의 기하학적 특징을 통합적으로 학습하는 'D2Dewarp' 모델을 제안하고, 이를 위해 자동 주석 생성 기술을 활용한 대규모 학습 데이터셋 'DocDewarpHV'를 구축하여 기존 최첨단 방법보다 우수한 성능을 입증했습니다.

Heng Li, Xiangping Wu, Qingcai Chen2026-03-05💻 cs

Towards Generalizable AI-Generated Image Detection via Image-Adaptive Prompt Learning

이 논문은 훈련 후 고정된 프롬프트 대신 각 테스트 이미지에 따라 동적으로 조정되는 '이미지 적응형 프롬프트 학습 (IAPL)'을 제안하여, 훈련 데이터에서 보지 못한 새로운 생성 모델로 만든 위조 이미지에 대한 일반화 성능과 강건성을 크게 향상시킨다고 요약할 수 있습니다.

Yiheng Li, Zichang Tan, Guoqing Xu + 3 more2026-03-05💻 cs

GaitSnippet: Gait Recognition Beyond Unordered Sets and Ordered Sequences

이 논문은 기존 순차적 또는 집합적 접근법의 한계를 극복하고, 인간 보행의 개별 동작을 무작위로 추출된 '스니펫 (snippet)'으로 모델링하여 다중 스케일 시간적 맥락을 효과적으로 포착하는 새로운 보행 인식 프레임워크 'GaitSnippet'을 제안하고 여러 데이터셋에서 높은 성능을 입증합니다.

Saihui Hou, Chenye Wang, Wenpeng Lang + 2 more2026-03-05💻 cs