Do What I Say: A Spoken Prompt Dataset for Instruction-Following
Dit paper introduceert DoWhatISay (DOWIS), een meertalige dataset met gesproken en geschreven instructies om Speech Large Language Models realistischer te evalueren, waarbij blijkt dat tekstprompts vaak beter presteren dan gesproken prompts, behalve bij taken met spraakoutput.