RePo: Language Models with Context Re-Positioning

이 논문은 인지 부하 이론을 기반으로 컨텍스트의 고정된 순서 구조를 완화하여 불필요한 인지 부하를 줄이고, OLMo-2 모델을 기반으로 한 RePo 메커니즘을 통해 노이즈가 많은 맥락이나 긴 문맥에서도 성능을 향상시키는 새로운 언어 모델 접근법을 제안합니다.

Huayang Li, Tianyu Zhao, Deng Cai, Richard Sproat

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧠 핵심 아이디어: "책상 정리하기"

인공지능이 글을 읽거나 문제를 풀 때, 마치 책상 위에 모든 자료를 펼쳐놓고 작업하는 사람과 같습니다.

  1. 기존 방식 (기존 LLM):

    • 책상 위에 들어온 자료 (문장) 를 들어온 순서대로 일렬로 늘어놓습니다.
    • "첫 번째 문장, 두 번째 문장, 세 번째 문장..." 식으로 번호를 매겨서 처리합니다.
    • 문제점: 만약 책상 위에 **불필요한 잡동사니 (노이즈)**가 너무 많거나, **중요한 정보가 책상 끝쪽 (긴 문서)**에 숨겨져 있다면?
      • 인공지능은 "순서대로"만 보느라 머리가 피로해집니다. (인지 부하 증가)
      • 중요한 정보를 찾기 위해 책상 전체를 뒤져야 하므로, 진짜 중요한 생각 (추론) 을 할 에너지가 부족해집니다.
  2. 새로운 방식 (REPO):

    • REPO 는 인공지능에게 **"순서대로 놓지 말고, 중요도에 따라 책상을 재배치해라!"**라고 가르칩니다.
    • 들어온 정보를 보고, **"이건 핵심이야! (가까이 놓자)", "이건 그냥 잡동사니야! (멀리 치자)"**라고 스스로 판단하여 위치를 다시 정합니다.
    • 마치 명품 가게의 진열사처럼, 가장 중요한 보석 (핵심 정보) 을 가장 잘 보이는 곳에, 나머지는 구석에 배치하는 것과 같습니다.

🚀 REPO 가 해결하는 3 가지 문제

이 기술은 특히 다음과 같은 상황에서 인공지능의 실력을 비약적으로 높여줍니다.

1. "Haystack(건초더미) 속의 바늘 찾기" (Noisy Context)

  • 상황: 수천 줄의 긴 문서 속에 정답이 딱 하나 숨겨져 있고, 나머지는 다 헛소리일 때.
  • 기존 AI: "순서대로" 읽다가 지쳐서 정답을 놓칩니다.
  • REPO: "아, 이 부분이 정답이겠구나!" 하고 정답이 있는 부분을 가까이 끌어당겨 집중합니다. 잡동사니는 무시하고 정답만 쏙 집어냅니다.

2. "표 (Table) 데이터" (Structured Data)

  • 상황: 복잡한 표나 차트를 글자로 바꿨을 때 구조가 깨지는 경우.
  • 기존 AI: 글자 순서만 따라가서 "행과 열"의 관계를 잊어버립니다.
  • REPO: 표의 구조를 이해하고, 관련된 정보들을 그룹화해서 배치합니다. 마치 표를 다시 그려서 보기 쉽게 만드는 것과 같습니다.

3. "긴 문서 읽기" (Long Context)

  • 상황: 책 한 권 분량의 글을 읽고 마지막에 질문을 받으면.
  • 기존 AI: 처음에 읽은 내용은 기억이 흐려집니다. (기억력 한계)
  • REPO: 긴 문서에서도 중요한 부분과 질문 사이의 거리를 줄여줍니다. 마치 긴 줄을 접어서 중요한 부분끼리 붙여놓는 것처럼, 기억하기 쉽게 만들어줍니다.

🧩 어떻게 작동할까요? (비유: 지능형 도서관 사서)

기존 AI 는 책이 들어오는 **순서 (1 번, 2 번, 3 번)**만 따지는 자동 기계였습니다.

하지만 REPO지능형 도서관 사서처럼 작동합니다.

  • 독자가 "이 책의 300 페이지에 있는 내용이 중요해!"라고 말하면, 사서는 300 페이지를 바로 찾아서 독자의 책상 바로 앞에 가져다 줍니다.
  • 그리고 나머지 1~299 페이지는 뒤로 밀어둡니다.
  • 이렇게 하면 독자는 **책상 (작업 기억력)**이 넓어지고, 생각할 에너지를 더 많이 쓸 수 있게 됩니다.

이 기술은 인공지능이 자신의 뇌 (작업 기억력) 를 아껴서, 더 깊은 생각 (추론) 을 할 수 있게 해줍니다.


📊 결과는 어떨까요?

연구진은 이 기술을 적용한 인공지능을 테스트해 보았습니다.

  • 잡동사니가 많은 긴 글을 읽을 때 정답률이 훨씬 높아졌습니다.
  • 표나 차트를 이해하는 능력도 크게 향상되었습니다.
  • 짧은 대화를 할 때는 기존 방식과 똑같이 잘하지만, 긴 문서가 필요할 때는 압도적으로 잘합니다.

💡 결론

REPO는 인공지능에게 "무조건 순서대로 읽지 말고, 무엇이 중요한지 스스로 판단해서 정보를 재배치하라"는 새로운 능력을 선물한 기술입니다.

이제 인공지능은 더 이상 책상 위에 쌓인 서류 더미에 압도되지 않고, 중요한 정보를 쏙쏙 골라내어 더 똑똑하고 정확한 답변을 줄 수 있게 되었습니다. 앞으로 긴 문서 요약, 복잡한 데이터 분석, 그리고 더 긴 대화를 하는 AI 들의 핵심 기술이 될 것으로 기대됩니다.