Diagnosing and Repairing Citation Failures in Generative Engine Optimization

이 논문은 생성형 엔진 최적화 (GEO) 에서 인용 실패의 원인을 진단하고 맞춤형 개입을 수행하는 에이전트 시스템인 AgentGEO 를 제안하여, 기존 방법 대비 인용률을 40% 이상 향상시키면서 콘텐츠 수정량은 5% 로 최소화하는 효율적인 프레임워크를 제시합니다.

Zhihua Tian, Yuhan Chen, Yao Tang, Jian Liu, Ruoxi Jia

게시일 Wed, 11 Ma
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"AI 가 답변을 줄 때, 왜 내 웹사이트는 인용되지 않고 넘어가는가?"**라는 질문에 답하고, 그 문제를 해결하는 방법을 제시합니다.

기존의 방법들은 "내용을 더 길게 쓰거나, 더 전문적인 어조를 쓰라"는 일반적인 조언만 했다면, 이 논문은 **"왜 인용이 안 됐는지 원인을 찾아서 딱 맞는 치료제를 처방한다"**는 새로운 접근법을 소개합니다.

이 내용을 일상적인 비유로 쉽게 설명해 드릴게요.


1. 문제 상황: "보이지 않는 가게"

과거에는 사람들이 검색을 하면 검색 엔진이 웹사이트 목록을 보여줬습니다. 사람들은 목록을 보고 클릭해서 들어갔죠. (기존 검색 엔진)

하지만 요즘은 AI 가 답변을 바로 만들어 줍니다. (생성형 AI)

  • 예시: "제킬 박사를 연기한 배우는 누구?"라고 물으면, AI 가 바로 "한크 해리스입니다"라고 답하고, 그 뒤에 작은 숫자 [1] 을 붙여 출처를 알려줍니다.

여기서 큰 문제가 생겼습니다.

  • 사람들은 AI 가 바로 답을 해주니까, 출처 링크를 클릭할 확률이 1% 미만으로 떨어졌습니다.
  • 하지만, 만약 클릭이 된다면 그 방문자는 매우 가치 있는 고객입니다.
  • 결론: 웹사이트 주인들에게는 "링크가 클릭되는지"보다 **"AI 가 내 사이트를 출처로 인용해 주는지"**가 생사가 달린 문제입니다.

2. 기존 방법의 한계: "모두에게 같은 약을 주는 의사"

기존의 '생성형 엔진 최적화 (GEO)' 방법들은 웹사이트를 고칠 때 모든 사이트에 똑같은 규칙을 적용했습니다.

  • "통계를 더 넣어라."
  • "전문가 같은 말투로 써라."
  • "문장을 더 매끄럽게 고쳐라."

비유하자면:
모든 환자가 감기에 걸렸다고 가정하고, 모두에게 같은 감기약을 처방하는 것과 같습니다.

  • 어떤 환자는 코가 막혀서 (기술적 문제) 약이 필요하고,
  • 어떤 환자는 약이 너무 짜서 (내용 문제) 소금기를 줄여야 하며,
  • 어떤 환자는 약이 유통기한이 지났습니다 (정보 오래됨).

이런 개별적인 원인을 모르고 무작정 약을 주면, 오히려 병이 더 나빠질 수 있습니다.

3. 이 논문의 해결책: "AgentGEO" (똑똑한 진단사)

이 논문은 AgentGEO라는 시스템을 소개합니다. 이는 마치 정밀 진단을 하는 전문 의사와 같습니다.

작동 원리 (3 단계):

  1. 진단 (Diagnose):

    • AI 가 내 사이트를 인용하지 않은 이유를 찾아봅니다.
    • "아, 이 사이트는 HTML 코드가 깨져서 AI 가 내용을 읽지 못했구나 (기술적 문제)."
    • "아, 질문은 '한국 맛집'인데 사이트는 '미국 맛집' 정보만 있구나 (의도 불일치)."
    • "아, 중요한 정보가 페이지 맨 아래에 숨겨져서 AI 가 보지 못했구나 (내용 배치 문제)."
    • 이 논문은 실패 원인을 4 가지 큰 카테고리로 나누어 체계적으로 분류했습니다.
  2. 치료 (Repair):

    • 진단 결과에 따라 딱 맞는 치료 도구를 선택합니다.
    • 코드가 깨졌으면 코드를 고치고, 정보가 부족하면 사실을 추가하고, 정보가 숨겨져 있으면 위로 끌어올립니다.
    • 핵심: 전체를 다시 쓰는 게 아니라, 문제 있는 부분만 5% 정도만 수정합니다. (기존 방법은 25% 를 다 고쳐서 오히려 원본의 맛을 잃게 만들었습니다.)
  3. 검증 (Verify):

    • 고친 후 다시 AI 에게 물어봅니다. "이제 인용해 줄래?"
    • 아직 안 되면 다시 진단하고 치료합니다.

4. 새로운 기준: "한 번의 질문이 아닌, 다양한 질문"

기존 연구들은 "하나의 질문"에 대해 웹사이트를 최적화했습니다. 하지만 실제로는 사람들이 같은 내용을 묻더라도 수많은 다른 말투로 질문합니다.

  • 비유: "맛있는 피자"를 찾으러 온 사람도 있고, "저렴한 피자"를 찾는 사람도 있고, "생일 파티용 피자"를 찾는 사람도 있습니다.
  • 이 논문은 MIMIQ라는 새로운 테스트 기준을 만들었습니다. 하나의 웹사이트에 대해 수십 가지 다른 질문을 던져보고, 이 웹사이트가 모든 상황에서 잘 인용되는지 확인합니다.
  • 이렇게 하면 특정 질문에만 맞춰진 '가짜 최적화'를 막을 수 있습니다.

5. 주요 성과 및 교훈

  1. 정밀 치료가 승리: 무작정 고치는 것보다 원인을 찾아 고치는 것이 인용률을 40% 이상 높였습니다.
  2. 적은 수정, 큰 효과: 전체 내용을 25% 고치는 대신, 5% 만 고쳐도 효과가 훨씬 컸습니다.
  3. 모든 병은 고칠 수 없음: 때로는 경쟁사가 너무 강력하거나 (예: 위키피디아), 시스템적인 이유로 아무리 고쳐도 인용되지 않는 경우도 있습니다. 이 부분은 AI 의 편향성 문제이므로, 웹사이트 주인이 노력만으로는 해결할 수 없는 한계가 있음을 인정해야 합니다.

요약

이 논문은 **"AI 가 내 사이트를 인용하지 않는 이유를 찾아내어, 딱 맞는 부분만 고치는 지능형 시스템"**을 개발했습니다.

기존의 "무조건 더 길고 전문적으로 쓰라"는 조언 대신, **"왜 인용이 안 됐는지 진단하고, 그 이유에 맞춰 코드를 고치거나 정보를 배치하라"**는 맞춤형 처방을 통해 웹사이트 주인들이 AI 시대에 살아남을 수 있는 길을 제시합니다.