LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks
Le papier présente LoRA-Ensemble, une méthode efficace et économe en paramètres pour l'ensemble de modèles dans les réseaux à attention, qui utilise des matrices de faible rang partagées pour surpasser les techniques implicites existantes et égaler les ensembles explicites en précision tout en offrant une meilleure calibration des incertitudes.