Tokenization Allows Multimodal Large Language Models to Understand, Generate and Edit Architectural Floor Plans
El artículo presenta HouseMind, un modelo de lenguaje grande multimodal que utiliza tokens discretos de instancias de habitaciones para unificar la comprensión, generación y edición de planos arquitectónicos, logrando diseños coherentes y controlables mediante instrucciones de texto.