LoRA-Ensemble: Efficient Uncertainty Modelling for Self-Attention Networks
Il paper introduce LoRA-Ensemble, un metodo efficiente basato su Low-Rank Adaptation che, condividendo una rete pre-addestrata con proiezioni di attenzione a basso rango individuali, supera le tecniche implicite esistenti e raggiunge prestazioni e calibrazione dell'incertezza paragonabili o superiori a un ensemble esplicito, riducendo al contempo costi computazionali e memoria.