VerifAI: A Verifiable Open-Source Search Engine for Biomedical Question Answering

이 논문은 검색 증강 생성 (RAG) 과 후속 주장 검증 메커니즘을 결합하여 의료 분야 질문 답변의 사실 일관성을 보장하고 환각을 줄이는 오픈소스 시스템 'VerifAI'를 소개합니다.

Miloš Košprdic, Adela Ljajic, Bojana Bašaragin, Darija Medvecki, Lorenzo Cassano, Nikola Miloševic

게시일 2026-04-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

VerifAI: 의학적 질문에 답할 때 "거짓말"을 잡아주는 똑똑한 검색 엔진

이 논문은 VerifAI(베리파이) 라는 새로운 인공지능 시스템을 소개합니다. 이 시스템은 의학적 질문에 답할 때, AI 가 흔히 하는 실수인 '환각 (Hallucination)', 즉 사실과 다른 내용을 그럴싸하게 지어내는 문제를 해결하기 위해 만들어졌습니다.

이 복잡한 기술을 일상적인 비유로 쉽게 설명해 드리겠습니다.


1. 문제: "거짓말쟁이" AI 와 신뢰의 위기

우리가 AI 챗봇에게 "감기약과 진통제를 같이 먹어도 될까요?"라고 물으면, AI 는 아주 유창하고 자신감 있게 답변을 해줍니다. 하지만 문제는 그 답변이 사실일지, 아니면 AI 가 멋대로 지어낸 이야기일지 우리가 알 수 없다는 점입니다.

이는 마치 재능은 있지만 기억력이 나쁜 유능한 요리사와 같습니다. 그는 요리를 아주 맛있게 만들어내지만, 레시피를 기억하지 못해 "소금 대신 설탕을 넣어도 됩니다"라고 거짓말을 할 수도 있습니다. 생명과 직결된 의학 분야에서 이런 거짓말은 치명적일 수 있습니다.

2. 해결책: VerifAI 의 3 단계 "검증 시스템"

VerifAI 는 단순히 답변을 만들어내는 것이 아니라, 답변의 진위를 3 단계로 꼼꼼히 확인하는 시스템입니다. 이를 '검색 - 요리 - 검사'의 과정으로 비유해 볼 수 있습니다.

1 단계: 신뢰할 수 있는 도서관 사서 (검색 모듈)

  • 비유: 인터넷 전체를 뒤지는 것이 아니라, 공신력 있는 의학 도서관 (PubMed) 에만 집중하는 전문 사서입니다.
  • 작동 원리: 사용자가 질문을 하면, 이 사서는 수천만 편의 의학 논문 중에서 가장 관련성 높은 10 편의 논문을 찾아냅니다. 단순히 키워드만 매칭하는 것이 아니라, 문맥을 이해하여 가장 정확한 자료를 골라냅니다.
  • 결과: AI 가 답변할 때 근거가 되는 '진짜 책'을 먼저 준비해 둡니다.

2 단계: 레시피를 보고 요리하는 셰프 (생성 모듈)

  • 비유: 이제 앞서 사서가 찾아온 10 편의 논문만 보고 요리를 하는 셰프가 나옵니다.
  • 작동 원리: 이 셰프는 자신의 기억 (AI 의 지식) 을 믿지 않습니다. 오직 손에 든 논문 내용만 참고하여 답변을 작성합니다. 그리고 매 문장마다 "이 말은 3 번 논문 5 페이지에 있습니다"라고 출처를 명시합니다.
  • 특징: 이 셰프는 특별히 훈련을 받아, 논문 내용을 잘 요약하고 출처를 정확히 밝히는 법을 배웠습니다.

3 단계: 엄격한 맛보기 심사위원 (검증 모듈)

  • 비유: 요리가 완성되면, 가장 엄격한 맛보기 심사위원이 등장합니다. 이 심사위원은 셰프가 쓴 답변과 원본 논문을 하나하나 비교합니다.
  • 작동 원리:
    • 초록색: 논문 내용을 정확히 인용했으니 "통과" ✅
    • 노란색: 논문 내용과 비슷하지만 약간의 차이가 있으니 "주의" ⚠️
    • 빨간색: 논문 내용과 정반대이거나 근거가 없으니 "거짓말" ❌
    • 회색: 출처가 아예 없으니 "확인 필요" ⚫
  • 핵심: 이 심사위원은 거대하고 비싼 AI(GPT-4 등) 보다 의학 전문 지식을 바탕으로 훈련된 작은 AI입니다. 그래서 의학 논문의 미묘한 뉘앙스를 더 정확하게 파악하여 거짓말을 잡아냅니다.

3. 왜 이 시스템이 특별한가요?

  1. 투명성 (Transparency): VerifAI 는 답변을 줄 때, 각 문장이 어떤 논문을 바탕으로 했는지 색깔로 보여줍니다. 사용자가 "이 문장이 빨간색이네? 아, 이 말은 근거가 없구나"라고 바로 알 수 있습니다.
  2. 작지만 똑똑한 모델: 보통 AI 는 거대할수록 좋다고 생각하지만, VerifAI 는 작은 모델 (SLM) 을 전문적으로 훈련시켜, 거대 모델보다 더 정확한 인용과 검증을 해냅니다. 이는 비용도 절감하고 속도도 빠르게 합니다.
  3. 오픈 소스: 이 시스템의 모든 코드와 데이터는 공개되어 있어, 누구나 검증하고 개선할 수 있습니다. "블랙박스"가 아닌, 누구나 들여다볼 수 있는 "유리 상자" 같은 시스템입니다.

4. 결론: 신뢰할 수 있는 AI 의 미래

VerifAI 는 AI 가 "알고 있는 척" 하는 것을 멈추게 하고, "알고 있는 것만, 그리고 그 근거를 보여주며" 말하게 만드는 시스템입니다.

의학, 법률, 금융처럼 사실 여부가 생명을 좌우하거나 큰 손해를 입히는 분야에서는, 화려한 답변보다 정확한 근거와 검증이 훨씬 중요합니다. VerifAI 는 이러한 분야에서 AI 를 안전하게 사용할 수 있는 길을 열어주는 혁신적인 도구입니다.

한 줄 요약:

VerifAI 는 AI 가 지어낸 거짓말을 잡아내기 위해, '전문 사서'가 자료를 찾고, '셰프'가 근거로 요리하며, '엄격한 심사위원'이 하나하나 검증하는 3 인 1 조의 검증 시스템입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →