WebExpert: domain-aware web agents with critic-guided expert experience for high-precision search

이 논문은 금융, 바이오, 제약 등 도메인 특화 웹 작업에서 검색의 정확도를 높이기 위해 문장 수준의 경험 검색, 약한 감독 기반의 스키마 경량 팩트 유도, 그리고 선호도 최적화 계획을 결합한 'WebExpert'라는 도메인 인식 웹 에이전트를 제안합니다.

Yuelin Hu, Zhengxue Cheng, Ronghua Wu, Qunshan Gu, Hongwei Hu, Wei Liu, Qiao Liang, Li Song

게시일 2026-04-09
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🕵️‍♂️ 비유: "초보 탐정 vs. 베테랑 형사"

상상해 보세요. 일반적인 AI는 이제 막 수사대에 들어온 초보 탐정과 같습니다.

  • 문제: "이 사건을 해결해 줘"라고 하면, 초보 탐정은 막연하게 "범인 찾기"라고 검색창에 입력합니다.
  • 결과: 관련 없는 뉴스, 오래된 정보, 헛된 단서들이 잔뜩 쏟아져 나옵니다. 이 중에서 진짜 단서를 찾아내려면 시간을 많이 쓰고, 때로는 엉뚱한 길로 빠지기도 합니다. 특히 금융, 의학, 법률처럼 전문 지식이 필요한 분야에서는 더더욱 막막해집니다.

반면, 이 논문에서 만든 WebExpert는 수십 년간 현장에서 일해온 베테랑 형사와 같습니다.

  • 특징: 이 형사는 사건을 듣자마자 "아, 이 사건은 '서울시'에서 '지난달'에 발생한 '금융 사기' 사건이군. 그러면 '서울시 금융당국'의 '최근 규정'을 먼저 확인해야겠어"라고 바로 생각합니다.
  • 핵심: 검색하기 전에 **전문가들의 경험 (Expert Experience)**을 미리 꺼내어 검색 방향을 정확히 잡는 것입니다.

🛠️ WebExpert 가 어떻게 작동할까요? (3 단계 미션)

이 시스템은 크게 세 가지 단계로 이루어져 있습니다.

1 단계: "현장 경험장 (Experience Base) 만들기"

  • 무엇을 하나요? 과거의 성공적인 질문과 답변, 그리고 전문가들이 남긴 팁들을 모아서 **작은 규칙 (Rules)**으로 정리합니다.
  • 비유: 마치 형사들이 수백 건의 사건을 분석해서 "금융 사기 사건일 때는 반드시 '지역'과 '시점'을 확인해야 한다"는 수사 매뉴얼을 만드는 것과 같습니다.
  • 기술적 특징: 단순히 텍스트를 모으는 게 아니라, 비슷한 주제끼리 묶고 (Topic Merging), 중복된 내용은 제거하며, 핵심만 추려냅니다.

2 단계: "검색 전, 전문가의 조언 듣기 (Experience Retrieval)"

  • 무엇을 하나요? 사용자가 질문을 던지면, AI 는 먼저 만든 '수사 매뉴얼'에서 관련된 조언을 찾아냅니다.
  • 비유: 초보 탐정이 사건을 맡으면, 베테랑 형사가 "이런 사건은 보통 A 지역과 B 시기에 많이 발생해. 검색할 때 이 키워드를 꼭 넣어!"라고 **조언 (Gate)**을 줍니다.
  • 효과: 검색어가 "돈 관련 뉴스"가 아니라 "2024 년 서울 금융 규제"처럼 정확한 방향으로 바뀝니다.

3 단계: "정밀 수사 (Deep Browsing)"

  • 무엇을 하나요? 이제 정확한 조언을 바탕으로 웹을 검색하고, 필요한 정보를 찾아 답을 만듭니다.
  • 비유: 조언을 들은 탐정은 불필요한 길을 돌아다니지 않고, 가장 확실한 단서가 있는 곳으로 직행합니다. 그래서 더 적은 횟수 (Page Hops) 로 더 정확한 답을 찾아냅니다.

🌟 왜 이 기술이 특별한가요?

  1. 전문 분야에 강합니다:

    • 일반 AI 는 "의학적 조언"을 검색할 때 "의사에게 물어보세요" 같은 뻔한 답만 줍니다. 하지만 WebExpert 는 "해당 질병의 '지역별 치료 가이드라인'과 '최신 임상 시험'을 확인해야 한다"는 전문적인 맥락을 먼저 이해하고 검색합니다.
  2. 실수 (할루시네이션) 를 줄입니다:

    • 검색어가 정확해지므로, 엉뚱한 정보를 믿고 답을 만드는 실수가 크게 줄어듭니다.
  3. 효율적입니다:

    • 불필요한 웹 페이지를 몇 번이나 클릭할 필요가 없어집니다. (논문 결과에 따르면 페이지 이동 횟수가 크게 감소했습니다.)

📊 실제 성과 (시험 성적)

이 시스템을 다양한 시험 (GAIA, GPQA 등) 에 적용해 보니, 기존에 가장 잘하던 AI 들보다 정답률 (Exact Match) 이 1.5~3.6% 포인트 더 높았습니다.

  • 숫자로만 보면 작아 보일 수 있지만, AI 가 복잡한 문제를 풀 때 매우 큰 차이입니다. 마치 수능 시험에서 1 등과 2 등 사이의 격차를 좁히는 것과 같습니다.

💡 한 줄 요약

WebExpert는 "검색하기 전에 전문가의 경험을 먼저 참고해서, 검색어를 전문가 수준으로 다듬은 뒤 웹을 찾아보게 만든 똑똑한 AI 비서"입니다.

이제부터 AI 가 검색을 할 때, 단순히 키워드를 입력하는 게 아니라 전문가의 눈으로 상황을 파악하고 가장 중요한 정보를 찾아낸다고 생각하시면 됩니다!

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →