Self-Aug: Query and Entropy Adaptive Decoding for Large Vision-Language Models
Il paper presenta "Self-Aug", una strategia di decoding senza addestramento che migliora la coerenza fattoriale dei Large Vision-Language Models combinando un prompting di auto-aumento dipendente dalla query con un algoritmo di soglia adattiva basato sull'entropia.