Do Foundation Models Know Geometry? Probing Frozen Features for Continuous Physical Measurement
Il paper dimostra che i modelli fondazionali vision-language possiedono una ricca conoscenza geometrica nei loro feature congelati, accessibile tramite semplici sonde lineari con alta precisione, rivelando che le limitazioni nella misurazione fisica derivano principalmente da deficit nel percorso di generazione testuale e non dalla rappresentazione visiva stessa.