MC-LLaVA: Multi-Concept Personalized Vision-Language Model
El artículo presenta MC-LLaVA, un modelo de visión y lenguaje personalizado que supera las limitaciones de los enfoques actuales al integrar múltiples conceptos simultáneamente mediante un ajuste fino de instrucciones, prompts personalizados y un nuevo conjunto de datos de alta calidad para mejorar la interacción con el usuario.