RefTool: Reference-Guided Tool Creation for Knowledge-Intensive Reasoning

이 논문은 교과서 및 지식 조각과 같은 외부 자료를 참조하여 실행 가능한 도구를 자동으로 생성하고 계층적으로 구성하는 'RefTool' 프레임워크를 제안함으로써, 대형 언어 모델이 지식 의존적 추론 과제의 한계를 극복하고 정확도와 일반화 성능을 크게 향상시킨다는 것을 보여줍니다.

Xiao Liu, Da Yin, Zirui Wu, Yansong Feng

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

REFTOOL: "교과서"를 보고 "도구"를 만들어 문제를 해결하는 AI

이 논문은 REFTOOL이라는 새로운 AI 시스템을 소개합니다. 이 시스템은 거대한 언어 모델 (LLM) 이 복잡한 과학 문제나 전문적인 지식을 다룰 때, 자신의 머릿속 지식만 믿지 않고 외부 자료 (교과서, 지식 조각 등) 를 참고해서 직접 필요한 '도구'를 만들어 문제를 해결하는 방식을 제안합니다.

이 내용을 일반인이 이해하기 쉽게 비유와 일상적인 언어로 설명해 드리겠습니다.


1. 왜 이런 연구가 필요할까요? (문제 상황)

비유: "요리사 vs. 레시피 없는 요리"

생각해 보세요. 유명한 요리사 (AI) 가 있다고 칩시다. 이 요리사는 평소에는 훌륭한 요리를 해냅니다. 하지만 갑자기 "에볼라 바이러스를 치료하는 약을 만들어줘" 혹은 **"아주 낯선 외계 식물의 성분을 분석해줘"**라는 요청을 받으면 어떨까요?

  • 기존 방식의 한계: 요리사가 자신의 기억 (내부 지식) 만 믿고 요리를 하려다 보니, 본 적도 들어본 적도 없는 재료를 다룰 때 실패하거나 엉뚱한 요리를 만들어냅니다.
  • 기존 해결책의 부족: "그럼 요리사에게 '이런 재료를 쓰면 돼'라고 알려주고, 요리사가 그걸로 도구를 만들어봐"라고 시켰을 때, 요리사가 그 재료를 어떻게 다뤄야 할지 몰라 도구를 엉망으로 만들거나 아예 만들지 못합니다.

즉, AI 는 자신이 배운 지식 밖의 새로운 분야에서는 '어떻게' 도구를 만들어야 할지 모르는 것입니다.

2. REFTOOL 은 어떻게 해결할까요? (해결책)

비유: "전문가에게서 레시피를 배워 직접 주방 도구를 만드는 요리사"

REFTOOL 은 AI 에게 다음과 같은 두 단계를 거치게 합니다.

1 단계: 도구 만들기 (Tool Creation) - "교과서 보고 도구 설계도 그리기"

  • 상황: AI 가 문제를 해결할 때, 관련 교과서나 전문 서적을 먼저 읽게 합니다.
  • 행동: AI 는 교과서의 내용을 보고, "이 문제를 풀려면 이런 계산이 필요하구나"라고 파악한 뒤, **실제로 작동하는 컴퓨터 코드 (도구)**를 직접 작성합니다.
  • 검증: 만든 도구가 제대로 작동하는지 간단한 예제 (연습문제) 로 테스트합니다. 실패하면 고치고, 성공하면 **정리된 도구상자 (Toolbox)**에 넣습니다.
    • 예시: "역확률 가중치 (Inverse Probability Weighting)"라는 통계 개념이 교과서에 나오면, AI 는 이를 이해하고 compute_ate_ipw 라는 이름의 실제 계산 코드를 만들어냅니다.

2 단계: 도구 활용 (Tool Utilization) - "도구상자에서 알맞은 도구 꺼내기"

  • 상황: 이제 실제 질문 (예: "A 와 B 의 인과관계는 무엇인가?") 이 들어옵니다.
  • 행동: AI 는 방금 만든 도구상자를 뒤집니다. 질문의 성격에 맞는 **카테고리 (예: '추정' 카테고리)**를 먼저 찾고, 그 안에서 가장 적합한 **도구 (예: '인과방향 적합' 도구)**를 꺼냅니다.
  • 결과: 꺼낸 도구를 사용해 정답을 도출합니다.

3. 핵심 장점 (왜 이것이 특별한가?)

  1. 지식의 한계를 넘습니다: AI 가 몰랐던 분야라도, 교과서만 있다면 그 분야의 전문가처럼 도구를 만들어 문제를 풀 수 있습니다. 마치 요리사가 새로운 재료가 적힌 요리책만 보고도 그 재료를 활용한 요리를 개발하는 것과 같습니다.
  2. 정확하고 신뢰할 수 있습니다: 도구를 만들 때 교과서 내용을 그대로 반영하고, 예제로 검증하므로 "AI 가 헛소리를 하는 (할루시네이션)" 현상을 줄여줍니다.
  3. 효율적입니다: 매번 실패하고 다시 시도하는 방식이 아니라, 한 번 만든 도구는 여러 문제에서 다시 쓸 수 있어 시간과 비용을 아낍니다.
  4. 과학뿐만 아니라 언어 번역에도 통합니다: 아주 드문 언어 (예: 중국 소수민족 언어) 를 번역할 때도, 문법 규칙이라는 '교과서'를 보고 번역 도구를 만들어 번역 품질을 높였습니다.

4. 실제 성과 (결과)

논문에서는 인과관계, 물리학, 화학이라는 세 가지 어려운 과학 분야에서 실험을 했습니다.

  • 기존 방법들보다 정확도가 평균 12.3% 이상 향상되었습니다.
  • 특히, 교과서를 참고하지 않고 AI 가 혼자 도구를 만들려고 시도한 방법들보다 훨씬 잘 작동했습니다.
  • 비용도 기존 방법들보다 훨씬 저렴하고 빠릅니다.

5. 요약: 한 줄로 정리하면?

"REFTOOL 은 AI 에게 '내 기억'만 믿지 말고, '교과서'를 참고해서 문제를 풀기 위한 '실제 도구'를 직접 만들고 검증하게 함으로써, AI 가 모르는 분야에서도 전문가처럼 정확하게 문제를 해결하게 해주는 시스템입니다."

이 기술은 AI 가 단순히 지식을 암기하는 것을 넘어, 새로운 지식을 습득하여 즉시 적용하는 능력을 갖추게 하는 중요한 한 걸음입니다.