OSGym: Scalable Distributed Data Engine for Generalizable Computer Agents

이 논문은 학술적 예산 내에서 1,000 개 이상의 OS 복제본을 병렬로 실행하여 컴퓨터 에이전트 학습을 위한 확장성, 범용성, 경제성을 갖춘 분산 데이터 엔진 'OSGym'을 소개하고 그 유효성을 입증합니다.

Zengyi Qin, Jinyuan Chen, Yunze Man, Shengcao Cao, Ziqi Pang, Zhuoyuan Wang, Xin Sun, Gen Lin, Han Fang, Ling Zhu, Zixin Xie, Zibu Wei, Tianshu Ran, Haoran Geng, Xander Wu, Zachary Bright, Qizhen Sun, Rui Wang, Yuyang Cai, Song Wang, Jiace Zhao, Han Cao, Yeyang Zhou, Tianrui Liu, Ray Pan, Chongye Yang, Xiang Ren, Bo Zhang, Yutong Ban, Jitendra Malik, Pieter Abbeel

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

1. 왜 이 시스템이 필요한가요? (문제 상황)

지금까지 AI 비서를 훈련시킬 때는 주로 **'특정 게임'**이나 '웹사이트' 같은 좁은 공간 (샌드박스) 에서만 연습시켰습니다.

  • 비유: 마치 운전 면허를 따기 위해 오직 '주차 연습장'에서만 차를 몰게 하는 것과 같습니다. 실제 도로 (컴퓨터 전체) 에 나가면 당황할 수밖에 없죠.
  • 문제: 진짜 컴퓨터 (운영체제) 전체를 시뮬레이션해서 AI 에게 가르치려면 컴퓨터 수천 대를 동시에 돌려야 하는데, 전기세 (비용) 가 너무 비싸서 대학이나 연구실에서는 감당하기 힘들었습니다.

2. OSGym 은 어떻게 해결하나요? (핵심 아이디어)

OSGym 은 "천 마리의 토끼를 잡되, 한 마리당 드는 비용은 아주 적게" 하는 방법을 찾았습니다.

① ' decentralization(분산화)': 중앙 관리자가 아닌, 각자 책임지기

  • 기존 방식: 한 명의 무거운 감독이 천 마리의 말 (컴퓨터) 을 모두 통제하면, 감독이 지치거나 실수하면 전체가 멈춥니다.
  • OSGym 방식: 각 말 (컴퓨터) 마다 작은 훈련 코치를 붙입니다. 한 말에 문제가 생겨도 다른 말들은 계속 달립니다. 마치 수천 개의 독립된 훈련실이 있는 거대한 체육관처럼, 한 방이 불타도 전체 체육관이 멈추지 않습니다.

② '하드웨어 최적화': 비싼 CPU 가 아니라, 저렴한 RAM 활용하기

  • 발견: 컴퓨터를 여러 대 켤 때, CPU(두뇌) 는 많이 필요하지만, RAM(작업 공간) 은 상대적으로 싸다는 사실을 발견했습니다.
  • 비유: 비싼 '슈퍼 컴퓨터' 한 대를 사는 대신, 저렴한 '작은 책상'을 많이 사서 그 위에 컴퓨터를 여러 대 쌓아 올리는 것입니다.
  • 결과: 기존에는 하루에 한 대를 돌리는 데 300 달러 (약 40 만 원) 가 들었는데, 이 방법을 쓰면 한 대당 하루 0.23 달러 (약 300 원) 정도로 비용을 1000 분의 1 로 줄였습니다. 대학 연구실도 감당할 수 있는 가격입니다.

③ '범용성': 어떤 일이라도 가능하게 하기

  • OSGym 은 특정 게임만 하는 게 아니라, 문서 작성, 웹 서핑, 그림 그리기, 코딩, 이메일 보내기 등 컴퓨터에서 할 수 있는 모든 일을 가르칠 수 있습니다.
  • 마치 만능 요리사를 키우기 위해, 특정 메뉴만 가르치는 게 아니라 전 세계 모든 요리 재료를 다 준비해 둔 것과 같습니다.

3. 실제로 얼마나 잘 작동하나요? (실험 결과)

연구팀은 이 시스템을 이용해 다음과 같은 놀라운 성과를 냈습니다.

  • 엄청난 속도: 컴퓨터 1024 대를 동시에 돌려, 매분 1420 개의 훈련 데이터를 만들어냈습니다. (예를 들어, 1 분 만에 수천 번의 '문서 편집'과 '웹서핑'을 시뮬레이션한 것)
  • 저렴한 비용: 이 엄청난 양의 데이터를 만드는 데 든 비용은 **약 43 달러 (약 6 만 원)**뿐이었습니다.
  • 성공적인 훈련: 이 데이터로 AI 를 가르쳤더니, 70 억 개의 파라미터 (뇌세포) 만 가진 작은 AI가 복잡한 컴퓨터 작업을 스스로 수행하는 능력을 갖게 되었습니다. (기존의 거대 모델과 견줄 만한 성능)

4. 요약: 왜 이 논문이 중요한가요?

이 논문은 **"AI 비서를 현실 세계에 투입하려면, 거대하고 비싼 시설이 아니라, 작고 저렴하며 튼튼한 훈련장이 필요하다"**는 것을 증명했습니다.

  • 과거: "AI 비서를 만들려면 천문학적인 돈이 필요하다."
  • OSGym 이후: "누구나 (대학, 작은 연구실) 적은 돈으로 수천 대의 컴퓨터를 돌려 AI 비서를 가르칠 수 있다."

이 시스템이 보편화되면, 앞으로 우리가 문서 정리, 예약 잡기, 복잡한 프로그램 조작 등을 대신해 줄 똑똑한 AI 비서들을 훨씬 더 쉽고 빠르게 개발할 수 있게 될 것입니다.

한 줄 요약:

OSGym 은 '천 마리의 컴퓨터'를 '한 마리 치' 비용으로 돌려, 누구나 AI 비서를 현실적으로 훈련시킬 수 있게 해주는 '가상 컴퓨터 훈련장'입니다.