Phi-4-reasoning-vision-15B Technical Report
Ce rapport technique présente Phi-4-reasoning-vision-15B, un modèle multimodal de raisonnement compact et open-weight qui démontre que des choix architecturaux rigoureux, une curation de données systématique et un encodage haute résolution permettent d'obtenir des performances compétitives avec moins de ressources de calcul.