WAFFLE: Finetuning Multi-Modal Models for Automated Front-End Development
Das Paper stellt Waffle vor, eine neue Feinabstimmungsmethode für multimodale Modelle, die durch eine strukturaware Aufmerksamkeitsmechanik und kontrastives Lernen die Umwandlung von UI-Designs in funktionale HTML-Codes verbessert und dabei bestehende Benchmarks signifikant übertrifft.