Global Minimizers of Sigmoid Contrastive Loss
Este artigo explica teoricamente as vantagens de sincronizar temperatura e viés treináveis na função de perda sigmoidal, introduzindo o conceito de "Constelações" para justificar o sucesso do modelo SigLIP, elucidar o fenômeno do "modality gap" e determinar a dimensão necessária para representações de alta qualidade.