SommBench: Assessing Sommelier Expertise of Language Models
Il paper introduce SommBench, un benchmark multilingue sviluppato in collaborazione con sommelier professionisti per valutare l'expertise enologica dei modelli linguistici, rivelando che, sebbene eccellano nelle domande teoriche, faticano significativamente nel completare le caratteristiche sensoriali e nell'abbinamento cibo-vino.