SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents
Das Paper stellt SWE-MiniSandbox vor, eine leichte, containerfreie Methode zur skalierbaren Reinforcement-Learning-Training von Software-Engineering-Agenten, die durch Kernel-isolierte Workspaces und Pre-Caching-Techniken den Speicherbedarf und die Vorbereitungszeit im Vergleich zu herkömmlichen Container-Ansätzen drastisch reduziert, ohne die Leistung zu beeinträchtigen.