Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training
Este estudio presenta un marco de entrenamiento centrado en datos de alta calidad y verificación de dificultad que, mediante destilación y ajuste fino, permite que el modelo ODA-Fin-RL-8B supere a los modelos financieros de código abierto más avanzados en diversas tareas financieras.