TURA: Tool-Augmented Unified Retrieval Agent for AI Search

이 논문은 정적 콘텐츠와 실시간 동적 정보를 모두 처리할 수 있도록 RAG 와 에이전트 도구 사용을 결합한 3 단계 프레임워크인 TURA 를 제안하여, 대규모 산업용 AI 검색 시스템의 실시간 요구사항을 충족한다고 설명합니다.

Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei Yin

게시일 Fri, 13 Ma
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

TURA: AI 검색을 위한 '똑똑한 도우미'의 등장

이 논문은 우리가 매일 사용하는 검색 엔진이 어떻게 더 똑똑해지고, 실시간으로 필요한 일을 대신해 줄 수 있게 되었는지 설명합니다. 바로 TURA(Tool-Augmented Unified Retrieval Agent for AI Search)라는 새로운 시스템을 소개합니다.

간단히 말해, TURA 는 **"책을 읽는 것 **(기존 검색)을 가능하게 해주는 AI 입니다.


1. 왜 새로운 시스템이 필요했을까? (기존의 문제점)

기존의 AI 검색 (RAG) 은 마치 방대한 도서관의 사서와 같습니다.

  • 장점: 도서관에 쌓여 있는 책 (웹사이트, 문서) 을 아주 빠르게 찾아서 요약해 줍니다.
  • 단점: 하지만 이 사서는 실시간으로 변하는 정보특정 행동을 취하는 것은 할 수 없습니다.

예를 들어 생각해 보세요:

"내일 서울에서 부산으로 가는 기차표가 몇 시에 있고, 가격이 얼마야?"라고 물었을 때,

  • 기존 AI: "인터넷에 떠도는 뉴스 기사나 블로그 글을 찾아봐요. 아마 10 시쯤 출발하는 기차가 있을 거예요."라고 추측만 합니다. (실제 표는 팔려서 없을 수도 있죠!)
  • TURA: "잠깐만요! 바로 철도 공사의 시스템에 접속해서 실시간으로 남은 표를 확인하고, 바로 예매해 드릴까요?"라고 말합니다.

기존 AI 는 '책'만 읽을 수 있지만, TURA 는 '문'을 열고 '실제 행동'을 할 수 있는 능력을 얻었습니다.


2. TURA 는 어떻게 작동할까? (3 단계 마법)

TURA 는 세 가지 핵심 단계로 이루어진 초능력을 가진 팀처럼 작동합니다.

1 단계: 의도 파악 및 도구 찾기 (Intent-Aware Retrieval)

  • 비유: 현명한 비서가 당신의 말을 듣고 필요한 '도구'를 골라내는 단계입니다.
  • 작동: 사용자가 "내일 여행 계획 짜줘"라고 하면, TURA 는 이 말을 여러 조각으로 나눕니다. (날씨 확인, 숙소 찾기, 관광지 추천 등). 그리고 수천 개의 가능한 도구 (날씨 앱, 호텔 예약 시스템, 지도 앱 등) 중에서 정확히 필요한 도구들만 빠르게 찾아냅니다.
  • 핵심: 사용자가 말한 '의도'를 정확히 파악해서, 쓸데없는 도구는 제외하고 필요한 도구만 선별합니다.

2 단계: 작업 계획 세우기 (DAG-based Task Planner)

  • 비유: 건설 현장의 감독관이 일을 효율적으로 배분하는 단계입니다.
  • 작동: 여러 가지 일을 동시에 해야 할 때, 순서대로 하나씩 하면 시간이 너무 걸립니다. TURA 는 어떤 일이 먼저 필요하고, 어떤 일은 동시에 해도 되는지 **작업 순서도 **(DAG)를 그립니다.
    • 예: "날씨"와 "숙소"는 동시에 검색해도 되지만, "숙소 위치"를 알아야만 "가장 가까운 맛집"을 찾을 수 있습니다.
  • 핵심: 독립적인 일은 **동시에 **(병렬로) 처리해서 시간을 획기적으로 단축시킵니다.

3 단계: 빠른 실행자 (Distilled Agent Executor)

  • 비유: 수련을 마친 젊은 기사가 거대한 용 (거대 AI) 의 지혜를 그대로 받아서 빠르게 행동하는 단계입니다.
  • 작동: 보통 이런 복잡한 일을 하려면 무겁고 느린 거대 AI 가 필요합니다. 하지만 TURA 는 거대 AI(선생님) 가 어떻게 생각해서 행동했는지 학습시킨 가볍고 빠른 AI(학생) 를 사용합니다.
  • 핵심: "생각하는 과정"은 학습했지만, 실제 실행할 때는 생각하는 시간을 생략하고 바로 정답을 내놓습니다. 그래서 속도가 매우 빠르고 비용도 적게 듭니다.

3. 실제 효과는 어떨까? (결과)

이 시스템은 바이두 (Baidu) 의 실제 검색 서비스에서 수천만 명의 사용자를 대상으로 테스트되었습니다.

  • 정확도 향상: 기존 방식보다 답변의 정확도가 훨씬 높아졌습니다. 특히 항공권, 기차표, 주식 가격 등 실시간 정보가 필요한 질문에서 압도적인 성과를 보였습니다.
  • 속도: 복잡한 작업을 병렬로 처리하고 가벼운 모델을 사용해서, 사용자는 기다림 없이 빠른 답변을 받습니다.
  • 사용자 만족: 사람들이 "이거 정말 유용해!"라고 느끼는 비율이 크게 증가했습니다.

4. 한 줄 요약

TURA는 단순히 정보를 찾아주는 '책장'을 넘어, 사용자의 요청을 듣고 **실제 행동 **(예매, 검색, 계산 등)을 수행할 수 있는 능동적인 AI 비서로 진화한 시스템입니다.

이제 AI 는 "그런 정보가 인터넷에 있을 거예요"라고 말하는 것을 넘어, **"네, 바로 확인하고 예약해 드릴게요!"**라고 말할 수 있게 되었습니다.