Phi-4-reasoning-vision-15B Technical Report
El informe técnico presenta Phi-4-reasoning-vision-15B, un modelo multimodal de razonamiento de 15 mil millones de parámetros y peso abierto que, gracias a una arquitectura cuidadosa, una curaduría rigurosa de datos y un enfoque híbrido, logra un rendimiento competitivo en tareas visuales y lingüísticas, destacando especialmente en razonamiento científico, matemático y de interfaces de usuario.