Is Position Bias in Dense Retrievers Built In-or Learned from Data?

본 논문은 밀집 검색기에서의 위치 편향이 모델 아키텍처에 내재된 것이 아니라 학습 데이터 내 증거의 분포에서 주로 학습된다는 것을 입증하며, 균형 잡힌 데이터 선별이 경쟁력 있는 검색 성능을 유지하면서 이러한 편향을 크게 완화할 수 있음을 보여줍니다.

원저자: Daegon Yu, SeungYoon Han, Woomyoung Park

게시일 2026-05-27✓ Author reviewed
📖 3 분 읽기☕ 가벼운 읽기

원저자: Daegon Yu, SeungYoon Han, Woomyoung Park

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

이 논문은 간단한 언어와 창의적인 비유를 사용하여 설명합니다.

핵심 질문: 편향은 선천적인가, 학습된 것인가?

거대한 책 도서관 안에서 특정 사실을 찾아야 하는 사서 한 명을 고용한다고 상상해 보세요. 이상한 문제를 발견합니다. 이 사서는 책의 중간이나 맨 끝에 정보가 있을 때 정보를 찾는 데 매우 서툴러요. 첫 페이지에 답이 있으면 거의 항상 찾아내지만, 500 페이지에 답이 있으면 종종 완전히 놓쳐버립니다.

이를 **위치 편향 (Position Bias)**이라고 합니다. 오랫동안 연구자들은 이 편향이 사서의 뇌 (컴퓨터 모델의 아키텍처) 에 '하드코딩'되어, 마치 눈이나 귀의 물리적 한계처럼 고정된 것이라고 생각했습니다. 그들은 "아, 사서는 첫 페이지 너머는 보지 못하는구나"라고 생각했죠.

이 논문은 다른 질문을 던집니다: 만약 이 사서가 태어날 때부터 나쁜 습관을 가지고 있는 것이 아니라, 훈련에 사용된 책들로부터 그 습관을 배운 것이라면 어떨까요?

실험: 사서 훈련시키기

이를 검증하기 위해 연구자들은 여덟 가지 다른 유형의 사서 (컴퓨터 모델) 를 위한 특수 훈련 캠프를 만들었습니다. 이 사서들은 서로 다른 '뇌 구조' (일부는 인코더, 일부는 디코더, 일부는 다른 수학적 기법을 사용함) 를 가지고 있었으므로, 본래 다른 성향을 보였어야 합니다.

연구자들은 합성 데이터를 사용하여 네 가지 명확한 훈련 시나리오를 설정했습니다.

  1. "시작만" 캠프: 사서에게 답이 텍스트의 맨 시작에 있는 질문들만 보여주었습니다.
  2. "중간만" 캠프: 답이 중간에 있는 질문들만 보여주었습니다.
  3. "끝만" 캠프: 답이 맨 끝에 있는 질문들만 보여주었습니다.
  4. "균형 잡힌" 캠프: 세 가지 상황을 모두 섞어서 보여주어, 사서가 답이 어디든 있을 수 있음을 배우도록 했습니다.

결과: 사서는 선생님을 따라합니다

결과는 놀랍고 매우 명확했습니다. 사서들은 자신의 '본래적인' 뇌 구조에 집착하지 않고, 훈련 캠프의 습관을 완전히 받아들였습니다.

  • "시작만" 사서들은 텍스트의 시작 부분에 집착하게 되었습니다. 답이 거기에 있으면 훌륭했지만, 끝에 있으면 완전히 실패했습니다.
  • "끝만" 사서들은 반대로 행동했습니다. 시작 부분을 무시하고 문서의 맨 끝에 있는 답을 찾는 전문가가 되었습니다.
  • "중간만" 사서들은 구체적으로 중간을 찾아보도록 학습했습니다.

비유: 방의 왼쪽에 서 있을 때만 개에게 '앉아'라고 명령한다고 상상해 보세요. 그다음에 오른쪽으로 이동하며 "앉아"라고 말하면 개는 하지 않을 것입니다. 개가 '앉는' 것을 못 하는 것이 아니라, "앉아"는 왼쪽에서만 일어난다고 배웠기 때문입니다. 마찬가지로 이 AI 모델들은 훈련 데이터가 지시한 곳에만 '관련 정보'가 존재한다고 배웠습니다.

약간의 본능적 선호도 (예: 시작 부분을 보는 경향) 를 가지고 시작했던 사서들조차 훈련 데이터에 맞춰 행동을 완전히 바꾸었습니다.

해결책: "균형 잡힌" 식단

이 논문은 사서에게 균형 잡힌 식단 ("균형 잡힌 캠프") 을 제공하면 어떤 일이 일어나는지도 테스트했습니다.

  • 결과: 시작, 중간, 끝 예시를 모두 섞어 훈련했을 때 사서들은 훨씬 더 신뢰할 수 있게 되었습니다. 책의 일부를 무시하는 행동을 멈췄습니다.
  • 교환 조건: 이것이 그들을 더 느리게 하거나 전체적으로 더 나쁘게 만들었을까요? 아닙니다. 편향된 사서들과 마찬가지로 답을 찾는 능력은 그대로 유지되면서 '맹점'만 사라졌습니다. 1 페이지든 500 페이지든 답이 어디에 있든 찾을 수 있게 되었습니다.

왜 이것이 중요한가

이 논문은 위치 편향이 기계 설계의 영구적인 결함이 아님을 결론 내립니다. 이는 공급된 데이터로부터 학습된 습관일 뿐입니다.

  • 문제: 많은 실제 세계 데이터셋 (뉴스 기사나 검색 로그 등) 은 자연스럽게 가장 중요한 정보를 시작 부분에 배치합니다. AI 를 이렇게 훈련시키면, AI 는 문서의 나머지 부분을 무시하도록 학습합니다.
  • 해결책: AI 의 뇌를 재건축하거나 복잡한 수학을 변경할 필요가 없습니다. 훈련 데이터를 더 잘 선별하기만 하면 됩니다. AI 가 답이 중간과 끝에 있는 예시들을 보도록 보장함으로써 편향을 '학습 해제'하고 더 견고하고 공정한 검색기를 만들 수 있습니다.

요약하자면: 편향은 선천적인 것이 아니라 학습된 것입니다. 그리고 학생이 올바른 연습 문제를 제공받으면 나쁜 공부 습관을 학습 해제할 수 있듯이, 이 AI 모델들도 균형 잡힌 훈련 데이터를 제공받으면 위치 편향을 학습 해제할 수 있습니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →