Agent Hunt: Bounty Based Collaborative Autoformalization With LLM Agents

이 논문은 대규모 LLM 에이전트들이 정적 계획 대신 보너스 기반 시장 메커니즘을 활용하여 상호작용적 정리 증명 (ITP) 환경에서 대수적 위상수학의 자동 형식화와 증명 탐색을 분산 협력적으로 수행하는 실험을 다룹니다.

Chad E. Brown, Cezary Kaliszyk, Josef Urban

게시일 Tue, 10 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"수학이라는 거대한 퍼즐을 해결하기 위해, 인공지능 에이전트들이 서로 경쟁하고 협력하는 시장 **(시장 경제)에 대한 실험 보고서입니다.

이 복잡한 내용을 일상적인 비유로 쉽게 설명해 드릴게요.

1. 배경: 왜 이런 실험을 했나요?

기존에 인공지능 (LLM) 이 수학 교재를 컴퓨터가 이해할 수 있는 형식으로 번역하는 '자동 형식화' 작업을 해왔지만, 한 명의 에이전트가 모든 일을 하려다 보니 속도가 너무 느렸습니다. 마치 한 명의 요리사가 거대한 뷔페 식당의 모든 요리를 혼자 만들려고 하다가 지쳐버리는 상황과 비슷합니다.

그래서 연구진은 **"여러 명의 요리사 **(에이전트)를 도입하기로 했습니다.

2. 핵심 아이디어: "상금 (Bounty) 시장"

이 실험의 핵심은 **'상금 시스템'**입니다.

  • 작업장: '메갈로돈 (Megalodon)'이라는 수학 증명 검증 프로그램이 있는 가상의 도시입니다.
  • 작업: 알기 어려운 위상수학 (Topology) 교재의 내용을 증명하는 것.
  • 시스템:
    1. 임무 공고: 먼저 수학자들이 (또는 AI 가) 증명해야 할 문제들을 나열하고, 각 문제마다 **'상금 **(보상)을 붙입니다. (예: "이 정리를 증명하면 100 달러를 드립니다.")
    2. 경쟁과 협력: 4 명의 AI 에이전트 (앨리스, 밥, 찰리, 데이브) 가 이 상금을 노리고 뛰어듭니다.
      • 경쟁: 누구보다 빨리 증명해서 상금을 가져가려 합니다.
      • 협력: 너무 어려운 문제는 "이건 내가 못하겠으니, 이 부분을 증명해 주는 사람에게 10 달러를 줄게"라고 **하위 상금 **(서브 상금)을 걸고 다른 에이전트에게 도움을 요청합니다.
    3. **보증금 **(Lock) 에이전트는 특정 문제를 "내가 증명할게!"라고 선언하며 상금의 10% 를 보증금으로 맡깁니다. 만약 다른 사람이 그 문제를 먼저 증명해 버리면, 보증금은 돌려받지만 상금은 못 받습니다.

3. 실험 결과: 얼마나 빨랐나요?

이 "AI 시장"은 놀라운 속도를 보여줬습니다.

  • 속도: 한 명의 에이전트가 하루에 약 7,000 줄의 코드를 작성하는 반면, 4 명의 에이전트가 협력하자 하루에 약 39,000 줄을 작성했습니다. 약 5 배 이상 빨라진 것입니다.
  • 상금 흐름: 에이전트들은 서로의 작업을 가로채기도 했지만 (경쟁), 서로의 부족한 부분을 채워주기도 했습니다 (협력). 마치 건설 현장에서 한 팀이 기초 공사를 하고, 다른 팀이 벽을 쌓으며, 또 다른 팀이 배관을 설치하는 것과 비슷했습니다.

4. 재미있는 에피소드와 문제점

  • 실수 교정: 처음에는 "연습문제"에도 상금을 붙여줬는데, 에이전트들이 연습문제를 증명하느라 시간을 낭비하는 바람에 연구진이 "연습문제에는 상금 주지 마!"라고 규칙을 수정했습니다.
  • AI 의 한계: 에이전트들이 '브라우어 고정점 정리' 같은 어려운 문제를 증명해냈지만, **'사인 **(sin) 함수의 정의가 컴퓨터에게는 너무 모호해서 막혔습니다. 마치 "원주율을 3.14 로 정의해라"라고 했을 때, AI 가 "어떤 3.14?"라고 혼란을 겪는 것과 비슷합니다. AI 는 스스로 더 정확한 정의를 만들어내야 했지만, 아직 그 수준에는 미치지 못했습니다.

5. 결론: 이 실험이 의미하는 바는?

이 논문은 **"중앙에서 모든 일을 지시하는 것보다, 에이전트들에게 상금을 걸고 자유롭게 경쟁하게 하는 것이 훨씬 빠르고 유연하다"**는 것을 증명했습니다.

마치 **크라우드소싱 **(대중 참여형 작업)이나 경매 시장처럼, AI 들이 스스로 일을 찾아서 하고, 서로 도와가며 거대한 수학의 산을 빠르게 정복해 나가는 새로운 방식을 제시한 것입니다.

한 줄 요약:

"한 명의 천재가 모든 문제를 푸는 대신, 여러 명의 AI 에게 '상금'을 걸고 서로 경쟁하게 했더니, 수학 증명 속도가 5 배나 빨라졌다!"