Learning to Unscramble: Simplifying Symbolic Expressions via Self-Supervised Oracle Trajectories
Die Autoren stellen einen selbstüberwachten maschinellen Lernansatz vor, der mithilfe von Oracle-Trajektorien und einem transformerbasierten Policy-Netzwerk komplexe mathematische Ausdrücke in der Hochenergiephysik nahezu perfekt vereinfacht und dabei bestehende Reinforcement-Learning-Methoden deutlich übertrifft.