Stable-LoRA: Stabilizing Feature Learning of Low-Rank Adaptation
Ce papier propose Stable-LoRA, une stratégie d'optimisation par rétrécissement des poids qui stabilise l'apprentissage des caractéristiques dans la méthode LoRA en éliminant les instabilités causées par l'initialisation non nulle, tout en surpassant les méthodes de base sans coût mémoire supplémentaire.