You Don't Need All That Attention: Surgical Memorization Mitigation in Text-to-Image Diffusion Models

이 논문은 텍스트-이미지 확산 모델의 훈련 데이터 암기 현상을 해결하기 위해, 프롬프트별 주의를 정교하게 조절하여 원본 훈련 이미지를 재현하지 않으면서도 프롬프트와 일치하는 고품질 이미지를 생성하는 새로운 프레임워크인 'GUARD'를 제안합니다.

Kairan Zhao, Eleni Triantafillou, Peter Triantafillou2026-03-03🤖 cs.AI

Latent Replay Detection: Memory-Efficient Continual Object Detection on Microcontrollers via Task-Adaptive Compression

이 논문은 제한된 메모리를 가진 마이크로컨트롤러에서 새로운 객체 카테고리를 학습할 수 있는 첫 번째 프레임워크인 '잠재 재현 감지 (LRD)'를 제안하며, 태스크 적응형 압축과 공간적 다양성을 고려한 예시 선택 기법을 통해 기존 이미지 저장 방식보다 훨씬 적은 메모리로 효율적인 지속적 객체 감지를 가능하게 합니다.

Bibin Wilson2026-03-03💻 cs

Towards Data-driven Nitrogen Estimation in Wheat Fields using Multispectral Images

이 논문은 작물 유형, 비료 시비 단계, 토양 조건, 기상 역학 등 외부 요인으로 인해 어려운 표적 살포 및 비료 시비 (TSF) 문제를 해결하기 위해 공간적·시간적 변이성을 고려한 신경망 기반 솔루션 TerrAI 를 제안하고, 실제 원격 감지 데이터를 통해 그 유효성을 검증했습니다.

Andreas Tritsarolis, Tomaž Bokan, Matej Brumen + 2 more2026-03-03💻 cs

Steering Away from Memorization: Reachability-Constrained Reinforcement Learning for Text-to-Image Diffusion

이 논문은 학습 데이터의 암기 현상을 방지하면서도 생성 품질과 프롬프트 정합성을 유지하기 위해, 확산 모델의 역동적 시스템 특성과 도달 가능성 분석을 결합해 메모리화 경로를 회피하는 강화학습 기반의 추론 프레임워크 'RADS'를 제안합니다.

Sathwik Karnik, Juyeop Kim, Sanmi Koyejo + 2 more2026-03-03🤖 cs.AI

From Scale to Speed: Adaptive Test-Time Scaling for Image Editing

이 논문은 이미지 편집 작업의 목표 지향적 특성을 반영하여, 난이도 기반 자원 할당, 편집 특화 검증, 그리고 의도 정합성 확인을 통한 조기 종료 전략을 도입한 'ADE-CoT' 프레임워크를 제안함으로써 기존 고정 예산 방식 대비 2 배 이상의 속도 향상과 성능 개선을 달성했다고 요약할 수 있습니다.

Xiangyan Qu, Zhenlong Yuan, Jing Tang + 9 more2026-03-03⚡ eess

GrapHist: Graph Self-Supervised Learning for Histopathology

이 논문은 조직 내 세포와 그 상호작용을 그래프로 모델링하여 효율적인 표현 학습을 가능하게 하는 그래프 기반 자기지도 학습 프레임워크 'GrapHist'를 제안하고, 이를 통해 기존 비전 기반 모델보다 적은 파라미터로 뛰어난 성능을 달성함과 동시에 해당 분야의 첫 대규모 그래프 벤치마크를 공개했습니다.

Sevda Öğüt, Cédric Vincent-Cuaz, Natalia Dubljevic + 4 more2026-03-03🤖 cs.LG

Physics-Consistent Diffusion for Efficient Fluid Super-Resolution via Multiscale Residual Correction

본 논문은 물리 법칙을 준수하는 다중 해상도 잔차 보정 및 멀티 웨이블릿 기반의 'ReMD' 프레임워크를 제안하여, 기존 확산 모델의 한계를 극복하고 유체 초해상도 작업에서 물리적 일관성을 유지하면서도 효율적으로 고품질 결과를 생성하는 방법을 제시합니다.

Zhihao Li, Shengwei Dong, Chuang Yi + 5 more2026-03-03🤖 cs.AI

EfficientPosterGen: Semantic-aware Efficient Poster Generation via Token Compression and Accurate Violation Detection

이 논문은 의미 인식 기반 정보 추출, 텍스트를 이미지로 변환하는 토큰 압축 기술, 그리고 보조 모델 없이 레이아웃 위반을 감지하는 알고리즘을 통해 학술 포스터 자동 생성의 효율성과 신뢰성을 혁신적으로 개선한 'EfficientPosterGen' 프레임워크를 제안합니다.

Wenxin Tang, Jingyu Xiao, Yanpei Gong + 6 more2026-03-03🤖 cs.AI

BiCLIP: Bidirectional and Consistent Language-Image Processing for Robust Medical Image Segmentation

BiCLIP 는 시각적 특징이 텍스트 표현을 반복적으로 정제하는 양방향 멀티모달 융합 메커니즘과 증강 일관성 목적 함수를 도입하여, 데이터 부족 및 이미지 열화 환경에서도 기존 최첨단 모델보다 뛰어난 성능을 보이는 견고한 의료 영상 분할 프레임워크를 제안합니다.

Saivan Talaei, Fatemeh Daneshfar, Abdulhady Abas Abdullah + 1 more2026-03-03💻 cs

FujiView: Multimodal Late-Fusion for Predicting Scenic Visibility

이 논문은 웹캠 이미지와 기상 데이터를 후기 융합 (late-fusion) 방식으로 결합하여 후지산의 경관 가시성을 5 개 카테고리로 예측하는 'FujiView' 프레임워크와 대규모 데이터셋을 제안하며, 단기 예측에는 이미지 기반 특징이, 장기 예측에는 기상 데이터가 각각 우세하게 작용하여 높은 정확도를 달성함을 보여줍니다.

Bryceton Bible, Shah Md Nehal Hasnaeen, Hairong Qi2026-03-03💻 cs

FlowPortrait: Reinforcement Learning for Audio-Driven Portrait Video Generation

이 논문은 다중 모달 기반의 오토레거시 생성 모델을 강화 학습 (GRPO) 과 인간 선호도 기반의 다중 모달 LLM 평가 시스템을 결합하여, 입모양 동기화, 자연스러운 표정, 그리고 운동의 일관성을 극대화한 고품질 오디오 기반 구두 영상 생성 프레임워크인 FlowPortrait 를 제안합니다.

Weiting Tan, Andy T. Liu, Ming Tu + 3 more2026-03-03🤖 cs.AI

SKINOPATHY AI: Smartphone-Based Ophthalmic Screening and Longitudinal Tracking Using Lightweight Computer Vision

이 논문은 저자원 및 원격 환경에서 전문 장비 없이도 스마트폰을 통해 안구 홍반 정량화, 깜빡임 빈도 추정, 동공 반사 분석, 공막 색소 지수화, 그리고 병변 침범 측정 등 5 가지 설명 가능한 모듈을 제공하는 경량 컴퓨터 비전 기반의 안과 선별 및 장기 추적 시스템 'SKINOPATHY AI'의 아키텍처, 알고리즘, 윤리적 한계를 제시합니다.

S. Kalaycioglu, C. Hong, M. Zhu + 1 more2026-03-03🤖 cs.LG