SarcasmMiner: A Dual-Track Post-Training Framework for Robust Audio-Visual Sarcasm Reasoning
SarcasmMiner is een versterkingsleringsframework voor post-training dat door middel van een dubbel-track distillatiestrategie en een generatieve beloningsmodel de robuustheid van audio-visuele sarcasme-herkenning verbetert door pragmatische incongruïteit op te lossen en hallucinaties te voorkomen.