Diagnosing Retrieval Bias Under Multiple In-Context Knowledge Updates in Large Language Models

이 논문은 대규모 언어 모델이 동일한 사실에 대해 여러 번의 컨텍스트 내 지식 업데이트를 처리할 때 발생하는 회상 편향을 인지 심리학의 AB-AC 간섭 패러다임에 빗대어 분석하고, 업데이트 횟수가 증가할수록 최신 정보의 정확도가 급격히 저하되며 기존 메커니즘으로는 이를 효과적으로 해결하기 어렵다는 점을 규명했습니다.

Boyu Qiao, Sean Guo, Xian Yang, Kun Li, Wei Zhou, Songlin Hu, Yunya Song

게시일 2026-03-16
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧠 제목: "AI 의 기억력 혼란: 같은 질문을 여러 번 바꿀 때 무슨 일이?"

1. 배경: AI 는 왜 헷갈릴까?

우리가 AI 에게 "이탈리아의 대통령은 누구야?"라고 물으면, AI 는 과거의 데이터와 최신 정보를 모두 알고 있습니다. 하지만 만약 AI 가 대화 중에 같은 주제에 대해 정보가 여러 번 바뀌는 상황을 마주친다면 어떻게 될까요?

  • 상황: "이탈리아 대통령은 A 야" → "아니야, B 로 바뀌었어" → "다시 C 로 바뀌었어" → "현재는 D 야"
  • 문제: AI 는 이 모든 정보 (A, B, C, D) 를 한 문장 안에 동시에 가지고 있게 됩니다. 이때 AI 가 **가장 최신 정보 **(D)를 찾아내는 데 실패하는 현상을 연구했습니다.

2. 실험: "기억력 테스트" (DKI 프레임워크)

연구팀은 심리학의 **'AB-AC 간섭 현상'**이라는 개념을 차용했습니다.

  • 비유: 친구에게 "내 이름은 A 야"라고 알려주고, 나중에 "아니야, 내 이름은 B 야"라고 다시 알려주면, 친구는 A 와 B 사이에서 헷갈려 합니다.
  • 실험 방법: 연구팀은 AI 에게 "이탈리아 대통령"이라는 질문 (단서) 을 주고, 그 뒤에 32 개에서 512 개까지의 대통령 이름이 순서대로 바뀌는 긴 목록을 보여줬습니다.
    • **질문 1 **(과거) "가장 처음에 나온 대통령은 누구야?"
    • **질문 2 **(현재) "가장 마지막에 나온 대통령은 누구야?"

3. 놀라운 발견: "과거는 완벽하지만, 현재는 망가진다"

실험 결과는 매우 흥미로웠습니다.

  • **과거 정보 **(첫 번째 이름) AI 는 거의 100% 정확하게 기억해냈습니다.
  • **최신 정보 **(마지막 이름) 업데이트 횟수가 늘어날수록 정답을 맞추는 비율이 급격히 떨어졌습니다.
  • 결론: AI 는 과거의 정보는 잘 기억하지만, 최신 정보로 업데이트하는 능력은 매우 약하다는 '검색 편향 (Retrieval Bias)'이 존재합니다. 업데이트가 많을수록 AI 는 최신 정보를 잊어버리고, 오래된 정보를 다시 꺼내 말합니다.

4. 왜 이런 일이 일어날까? (내부 신호 분석)

연구팀은 AI 의 뇌 (내부 작동 원리) 를 들여다봤습니다.

  • 비유: AI 가 정답을 고를 때, 마치 등불처럼 특정 정보에 집중해야 합니다.
  • 발견:
    • 정답을 맞춘 경우: AI 는 최신 정보에 집중하는 '등불'이 선명하게 켜졌습니다.
    • 틀린 경우: 등불이 아주 희미해지거나, 모든 방향으로 퍼져버려 (flat) 어느 정보를 선택해야 할지 분간하기 어렵게 되었습니다.
    • 즉, AI 가 틀릴 때는 내부적으로 "이게 최신 정보야!"라고 확신할 만한 단서가 사라진 상태였습니다.

5. 해결책 시도: "기억력 훈련" (개입 전략)

심리학에서 기억력을 돕는 방법들을 AI 에게 적용해 봤습니다.

  • 방법:
    • 반복 암기: "이 정보를 K 번 반복해서 읽어봐."
    • 의미 연결: "이 정보들이 서로 어떻게 연결되는지 설명해봐."
    • 망각 지시: "옛날 정보는 '구식'이라고 표시하고 최신 정보만 기억해."
  • 결과: 이런 방법들이 약간은 도움이 되었지만, 근본적인 문제를 완전히 해결하지는 못했습니다. 여전히 AI 는 최신 정보를 찾기 어려워했습니다.

💡 핵심 요약 (한 줄 평)

"AI 는 과거의 이야기를 아주 잘 기억하지만, 정보가 계속 바뀌는 '최신 뉴스'를 따라가는 데는 여전히 서툴러서, 자주 옛날 이야기를 꺼내 말합니다."

이 연구는 AI 가 긴 대화나 실시간 정보 업데이트가 필요한 상황 (예: 뉴스 요약, 주식 정보, 법률 변경 사항 등) 에서 얼마나 취약한지를 보여줍니다. 따라서 앞으로는 AI 가 최신 정보를 더 잘 추적하고, 오래된 정보와 혼동하지 않도록 하는 새로운 기술 개발이 필요하다고 결론 내립니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →