MJ1: Multimodal Judgment via Grounded Verification
Das Paper stellt MJ1 vor, einen multimodalen Richter mit 3 Milliarden Parametern, der durch verstärkendes Lernen, eine strukturierte visuelle Verifikationskette und einen Gegenfaktisch-Konsistenz-Preis trainiert wird, um die Genauigkeit auf dem MMRB2-Datensatz signifikant zu steigern und dabei deutlich größere Modelle wie Gemini-3-Pro zu übertreffen.