ReHARK: Refined Hybrid Adaptive RBF Kernels for Robust One-Shot Vision-Language Adaptation
이 논문은 CLIP 과 같은 대규모 비전 - 언어 모델의 원샷 적응 시 발생하는 안정성 - 가소성 딜레마를 해결하기 위해, 전역 근접 정규화와 하이브리드 사전 지식, 지원 세트 증강, 적응형 분포 보정, 다중 스케일 RBF 커널을 결합한 훈련 없는 프레임워크 'ReHARK'를 제안하여 11 개 벤치마크에서 기존 방법들을 압도하는 새로운 최첨단 성능을 달성했다고 요약할 수 있습니다.