TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas

이 논문은 대규모 데이터베이스의 불완전한 스키마 환경에서 에이전트가 능동적으로 관련 메타데이터를 식별하고 검증하는 4 단계 프로토콜과 이중 트랙 GRPO 전략을 결합한 TRUST-SQL 을 제안하여, 사전 메타데이터 로드 없이도 기존 베이스라인을 능가하는 뛰어난 Text-to-SQL 성능을 달성함을 보여줍니다.

Ai Jian, Xiaoyun Zhang, Wanrou Du, Jingqing Ruan, Jiangbo Pei, Weipeng Zhang, Ke Zeng, Xunliang Cai

게시일 2026-03-18
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ TRUST-SQL: "모르는 도서관"에서 정답을 찾는 똑똑한 비서

이 논문은 **"텍스트를 SQL(데이터베이스 검색어) 로 변환하는 기술"**에 대한 새로운 접근법을 소개합니다. 기존 방식의 문제점을 지적하고, 이를 해결하는 혁신적인 방법인 TRUST-SQL을 제안합니다.

쉽게 비유하자면, **"거대한 도서관에서 책 한 권을 찾는 일"**을 상상해 보세요.


1. 문제: "모든 책 목록을 미리 알려주는 도서관"은 현실적이지 않아요 📚❌

기존의 Text-to-SQL 기술들은 **모든 책의 목록 (전체 스키마)**을 비서에게 미리 다 알려주는 가정 (Full Schema Assumption) 위에서 작동해 왔습니다.

  • 상황: 비서가 도서관에 들어오자마자, "이 도서관엔 책이 10 만 권 있는데, 여기 전체 목록이 있어. 이걸 보고 답을 찾아줘"라고 말합니다.
  • 문제: 현실의 기업 데이터베이스는 책이 수만 권이고, 목록도 매일 바뀝니다. 게다가 목록에 없는 책이나 낡은 목록까지 다 알려주면 비서는 혼란에 빠집니다. "어디서부터 찾아야 하지?"라며 엉뚱한 책을 집어내거나, 아예 없는 책을 만들어 말하기도 합니다 (이를 환각, Hallucination이라고 합니다).

2. 해결책: TRUST-SQL, "스스로 찾아보는 탐정"이 되다 🕵️‍♂️✨

저자들은 **"모든 목록을 미리 알려주지 마라"**라고 말합니다. 대신 비서에게 **"스스로 필요한 책만 찾아오라"**는 새로운 규칙을 적용했습니다. 이것이 바로 TRUST-SQL입니다.

🌟 핵심 아이디어: 4 단계 탐험 프로토콜

비서는 이제 무작정 답을 말하지 않고, 다음과 같은 4 단계를 거칩니다.

  1. 탐험 (Explore): "어떤 책장이 있을까?"라고 도서관 사서에게 물어봅니다. (메타데이터 조회)
  2. 제안 (Propose): "찾아보니 'VIP 고객'이라는 책이 있네요. 이걸로 답을 찾아볼까요?"라고 확인된 정보만 바탕으로 계획을 세웁니다. (이 단계가 가장 중요! 엉뚱한 상상을 막아줍니다.)
  3. 생성 (Generate): 계획을 바탕으로 검색어 (SQL) 를 작성합니다.
  4. 확인 (Confirm): 작성한 검색어로 실제 책을 찾아보고, 정답이 맞는지 최종 확인합니다.

비유: 마치 미스터리 소설을 읽을 때, 모든 등장인물 목록을 처음에 다 주는 대신, 진실만 확인하며 사건을 해결해 나가는 탐정처럼 행동하는 것입니다.


3. 기술의 핵심: "두 개의 트랙"으로 학습하기 🏃‍♂️🏃‍♀️

이 비서가 어떻게 그렇게 똑똑해졌을까요? 바로 Dual-Track GRPO라는 특별한 학습법을 썼기 때문입니다.

  • 기존 방식의 문제: "최종 답이 맞으면 칭찬, 틀리면 야단"을 한 번에 줍니다. 그런데 "책 목록을 잘못 찾았을 때"와 "검색어를 잘못 썼을 때"를 구별하지 못해 비서가 혼란을 겪습니다.
  • TRUST-SQL 의 방식: 학습을 두 개의 트랙으로 나눕니다.
    1. 탐색 트랙: "올바른 책 (데이터) 을 찾았는가?"에 집중합니다.
    2. 생성 트랙: "찾은 책으로 올바른 답을 만들었는가?"에 집중합니다.

이렇게 별도로 칭찬하고 야단치기 때문에, 비서는 "책 찾는 법"과 "답 만드는 법"을 동시에 완벽하게 익히게 됩니다.


4. 놀라운 결과: "사전 정보 없이도" 더 잘한다! 🚀

실험 결과, TRUST-SQL 은 놀라운 성과를 보였습니다.

  • 사전 정보 불필요: 다른 비서들은 도서관 전체 목록을 미리 받아야 했지만, TRUST-SQL 은 아무것도 모른 채 시작해서 스스로 필요한 정보만 찾아냈습니다.
  • 성능 향상: 기존 모델보다 정확도가 30% 이상이나 높아졌습니다.
  • 견고함: 질문이 조금씩 달라지거나 (유의어 교체), 애매모호한 상황에서도 흔들리지 않고 정확한 답을 찾아냈습니다.

📝 한 줄 요약

TRUST-SQL은 "모든 정보를 미리 주면 오히려 혼란스러워하는" 기존 AI 와 달리, **"스스로 필요한 정보만 찾아내고 검증하는 탐정"**처럼 학습시켜, 거대하고 복잡한 데이터베이스에서도 정확한 답을 찾아내는 새로운 기술입니다.

이제 AI 는 더 이상 "외운 목록"에 의존하지 않고, 현실 세계의 복잡한 데이터 속에서도 스스로 길을 찾아 헤매지 않고 정답을 찾아낼 수 있게 되었습니다! 🎉

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →