Scaling Data Difficulty: Improving Coding Models via Reinforcement Learning on Fresh and Challenging Problems
Dit paper introduceert MicroCoder, een zorgvuldig samengesteld dataset van recente en uitdagende programmeerproblemen die via een geautomatiseerd vierstapsverwerkingsframework is gefilterd op moeilijkheidsgraad, en waaruit blijkt dat het trainen van coderingsmodellen hierop leidt tot aanzienlijk betere prestaties op complexe taken vergeleken met bestaande datasets.
Zongqian Li, Tengchao Lv, Shaohan Huang, Yixuan Su, Qinzheng Sun, Qiufeng Yin, Ying Xin, Scarlett Li, Lei Cui, Nigel Collier, Furu Wei2026-03-10🤖 cs.LG