MolmoSpaces: A Large-Scale Open Ecosystem for Robot Navigation and Manipulation

Die Arbeit stellt MolmoSpaces vor, ein vollständig offenes Ökosystem mit über 230.000 vielfältigen Innenräumen und annotierten Objekten, das eine skalierbare, simulatorunabhängige Benchmarking-Plattform für Roboter-Navigation und -Manipulation bietet und dabei eine starke Sim-zu-Real-Korrelation nachweist.

Yejin Kim, Wilbert Pumacay, Omar Rayyan, Max Argus, Winson Han, Eli VanderBilt, Jordi Salvador, Abhay Deshpande, Rose Hendrix, Snehal Jauhri, Shuo Liu, Nur Muhammad Mahi Shafiullah, Maya Guru, Ainaz Eftekhar, Karen Farley, Donovan Clay, Jiafei Duan, Arjun Guru, Piper Wolters, Alvaro Herrasti, Ying-Chun Lee, Georgia Chalvatzaki, Yuchen Cui, Ali Farhadi, Dieter Fox, Ranjay Krishna

Veröffentlicht 2026-02-20
📖 3 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Stell dir vor, du möchtest einen Roboter wie einen echten Menschen erziehen, damit er in unserer komplexen Welt zurechtkommt. Das Problem ist: Ein Roboter, der nur in einer perfekten, leeren Küche trainiert wurde, wird völlig verwirrt sein, wenn er in eine echte, unordentliche Wohnung kommt, in der die Kaffeetasse auf dem Boden liegt und die Tür klemmt.

Das Papier MolmoSpaces ist im Grunde eine riesige, offene digitale Spielwiese für Roboter, die genau dieses Problem lösen soll. Hier ist die Erklärung in einfachen Worten:

1. Die riesige digitale Welt (Das "Universum")

Bisher hatten Roboter-Forscher oft nur ein paar Dutzend Szenarien zum Üben. Das ist wie ein Schüler, der nur Mathe in einem leeren Raum lernt, aber nie im echten Leben rechnet.
MolmoSpaces baut hingegen über 230.000 verschiedene Innenräume nach.

  • Es gibt handgemachte Küchen und Schlafzimmer.
  • Es gibt computergenerierte ganze Häuser mit vielen Räumen.
  • Es gibt sogar spezielle Orte wie Museen, Cafés oder Werkstätten.
    Stell dir das wie einen riesigen Videospiele-Editor vor, der unendlich viele verschiedene Welten generieren kann, damit der Roboter nie auf die gleiche Situation trifft.

2. Die unzähligen Gegenstände (Das "Requisiten-Regal")

Ein Roboter muss nicht nur durch Räume laufen, er muss Dinge anfassen. In dieser Welt gibt es 130.000 verschiedene Objekte.

  • Von einfachen Tassen und Stühlen bis hin zu komplexen Dingen mit beweglichen Teilen (wie Kühlschranktüren oder Schubladen).
  • Das Besondere: Jedes Objekt hat eine "Bauanleitung" für die Physik. Der Roboter weiß also genau, wie schwer eine Tasse ist, ob sie zerbrechlich ist und wie man sie am besten greift.
  • Es gibt sogar 42 Millionen vorbereitete "Griff-Punkte". Stell dir vor, jemand hat für jedes Objekt schon vorher ausprobiert: "Wenn du hier greifst, rutscht es nicht." Das spart dem Roboter das mühsame Ausprobieren.

3. Der perfekte Trainer (Die "Flugzeug-Simulation")

Früher mussten Forscher Roboter physisch bewegen, um sie zu testen. Das ist teuer, langsam und gefährlich (wenn der Roboter gegen eine Vase fällt).
MolmoSpaces nutzt hochmoderne Physik-Engines (wie MuJoCo oder Isaac).

  • Die Analogie: Stell dir vor, du trainierst einen Piloten. Du lässt ihn nicht sofort ein echtes Flugzeug fliegen, sondern nutzt einen Flugsimulator. Wenn er abstürzt, passiert nichts. Er kann tausende Male üben, ohne dass Treibstoff oder Zeit verschwendet werden.
  • MolmoSpaces ist dieser Flugsimulator, aber für Roboter, die Dinge greifen, Türen öffnen und herumlaufen.

4. Der Prüfungsraum (Der "Führerschein")

Das Team hat einen Benchmark (eine Art Prüfungsheft) namens MolmoSpaces-Bench erstellt.

  • Hier müssen Roboter Aufgaben lösen wie: "Geh zur Küche, hol dir eine Tasse, bring sie zum Tisch und öffne die Kühlschranktür."
  • Die Tests sind so realistisch gestaltet, dass die Ergebnisse im Simulator fast zu 100 % mit dem übereinstimmen, was der Roboter in der echten Welt tun würde. Das ist wie ein Simulator-Test für den Führerschein, der so gut ist, dass man danach sofort auf die echte Straße darf.

5. Warum ist das wichtig? (Das "Offene Geschenk")

Das Wichtigste: Alles ist kostenlos und offen.

  • Früher hatten nur große Firmen mit viel Geld Zugang zu solchen Trainingsdaten.
  • Mit MolmoSpaces kann jeder Forscher (auch Studenten) diese riesige Welt nutzen, um bessere Roboter-Algorithmen zu entwickeln. Es ist wie ein gemeinsames Open-Source-Projekt, bei dem alle zusammenarbeiten, um die Zukunft der Robotik voranzubringen.

Zusammenfassung in einem Satz:

MolmoSpaces ist eine riesige, kostenlose digitale Spielwiese mit Millionen von Gegenständen und Szenarien, die es Robotern erlaubt, durch unendliches Üben in einer Simulation so sicher zu werden, dass sie später in unserer echten, chaotischen Welt wie Profis agieren können.

Erhalten Sie solche Paper in Ihrem Posteingang

Personalisierte tägliche oder wöchentliche Digests passend zu Ihren Interessen. Gists oder technische Zusammenfassungen, in Ihrer Sprache.

Digest testen →