Tokenization Allows Multimodal Large Language Models to Understand, Generate and Edit Architectural Floor Plans
Het paper introduceert HouseMind, een multimodaal groot taalmodel dat discrete tokens gebruikt om vloerplannen te begrijpen, te genereren en te bewerken, waardoor het coherente en controleerbare architecturale ontwerpen kan creëren op basis van tekstuele instructies.