SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents
Dit paper introduceert SWE-MiniSandbox, een lichtgewicht, container-vrije methode die schaalbaar reinforcement learning voor software-engineering-agenten mogelijk maakt door kernel-gebaseerde isolatie te gebruiken, wat leidt tot aanzienlijke besparingen in schijfruimte en opstarttijd zonder in te leveren op prestaties.