PSF-Med: Measuring and Explaining Paraphrase Sensitivity in Medical Vision Language Models
Il paper introduce PSF-Med, un benchmark che rivela come i modelli medico-visuali cambino le risposte a riformulazioni di domande, e dimostra che l'identificazione e la soppressione di specifiche caratteristiche sparse nel modello riducono significativamente questa instabilità, migliorando l'affidabilità clinica.