LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning

이 논문은 VAE 를 통해 구조화된 잠재 추론 공간을 구축하고 잠재 확산 모델을 활용하여 기존 LLM 의 자기회귀적 한계를 극복하며, 다양한 추론 경로를 병렬로 생성하고 전역적으로 수정·개선할 수 있는 새로운 추론 프레임워크인 LaDiR 을 제안합니다.

Haoqiang Kang, Yizhe Zhang, Nikki Lijing Kuang, Nicklas Majamaki, Navdeep Jaitly, Yi-An Ma, Lianhui Qin

게시일 2026-03-04
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🧠 라디르 (LaDiR): AI 가 생각하는 방식을 바꾼 새로운 혁신

이 논문은 거대 언어 모델 (LLM) 이 문제를 해결할 때, 기존 방식의 한계를 깨고 더 똑똑하고 창의적인 사고를 할 수 있게 해주는 새로운 방법론인 **'라디르 (LaDiR)'**를 소개합니다.

기존 AI 와 라디르의 차이를 이해하기 위해, **'글쓰기'**와 **'조각가'**의 비유를 들어보겠습니다.


1. 기존 AI 의 문제점: "한 번 쓴 글은 못 고치는 기계"

기존의 AI(자동회귀 모델) 는 글을 쓸 때 한 글자씩 순서대로 써나갑니다.

  • 비유: 마치 연필로 글을 쓰는 학생처럼 생각해보세요.
    • "2 + 2 는 4 입니다."라고 쓴 뒤, "아, 실수했네. 2+2 는 5 가 아니야!"라고 생각해도, 이미 써버린 '4'라는 글자는 지우지 못합니다.
    • 그 글자 위에 덧칠을 하거나, 뒤에서 "그건 농담이었어요"라고 설명해야 합니다.
    • 결과적으로, 처음에 잘못된 방향으로 생각하면 그 오류가 고쳐지지 않고 계속 이어져서 엉뚱한 결론에 도달하기 쉽습니다. 또한, 같은 생각만 반복해서 다양한 해법을 찾기 어렵습니다.

2. 라디르 (LaDiR) 의 아이디어: "점토로 조각하는 예술가"

라디르는 이 문제를 해결하기 위해 **확산 모델 (Diffusion Model)**과 **잠재 공간 (Latent Space)**이라는 기술을 결합했습니다.

  • 비유: 라디르는 점토 조각가와 같습니다.
    • 1 단계 (점토 만들기): AI 는 문제의 답을 바로 글자로 쓰지 않습니다. 대신, 문제의 핵심 아이디어를 **점토 덩어리 (잠재 토큰)**로 만듭니다. 이 점토는 아직 구체적인 글자가 아니라, "의미"와 "논리"가 담긴 추상적인 형태입니다.
    • 2 단계 (다듬기): 이제 AI 는 이 점토 덩어리를 반복적으로 다듬습니다.
      • 처음에는 점토가 뭉개져서 무슨 모양인지 모릅니다 (노이즈).
      • 하지만 AI 는 "아, 이 부분은 2+2 라야겠네", "아, 저 부분은 5 가 아니라 4 가 맞네"라고 점토를 다시 빚어냅니다.
      • 중요한 점은, 글자를 지우지 않고 점토 전체의 모양을 다시 잡을 수 있다는 것입니다. 실수가 나면 처음부터 다시 다듬을 수 있는 거죠.
    • 3 단계 (완성): 점토가 완벽한 모양 (올바른 논리) 으로 다듬어지면, 비로소 그 모양을 보고 **최종 답안 (글자)**을 씁니다.

3. 라디르가 가진 3 가지 슈퍼 파워

① "생각을 다시 다듬을 수 있다" (반복적 정제)

기존 AI 는 한 번 쓴 글자를 못 고치지만, 라디르는 점토를 다시 빚듯 논리를 반복해서 다듬습니다.

  • 예시: "2+2=5"라고 잘못 생각했다면, 점토 단계에서 "아니야, 4 가 맞아"라고 수정한 뒤, 최종 글자로 "4"를 씁니다. 이 과정에서 AI 는 스스로의 실수를 고칠 수 있습니다.

② "한 번에 여러 가지 길을 탐색한다" (다양성)

기존 AI 는 한 번에 한 가지 길만 걷습니다. 하지만 라디르는 동시에 여러 개의 점토 덩어리를 만들어 서로 다른 방향으로 다듬을 수 있습니다.

  • 비유: 미로에서 길을 찾을 때, 기존 AI 는 한 가지 길만 따라가다 막히면 끝입니다. 하지만 라디르는 동시에 100 개의 미로를 탐색하며, 가장 좋은 길을 찾아냅니다. 그래서 같은 문제라도 훨씬 다양한 해결책을 찾아냅니다.

③ "의미 있는 추상화" (해석 가능성)

라디르는 점토 (잠재 공간) 에서 사고합니다. 이 점토는 단순한 글자 나열이 아니라, 의미의 덩어리입니다.

  • 장점: AI 가 왜 그런 결론을 내렸는지, 그 '생각의 과정'을 점토 형태로 볼 수 있어 훨씬 투명하고 이해하기 쉽습니다.

4. 실제 성과: 수학, 코딩, 퍼즐에서 압도적

연구진은 라디르를 수학 문제, 코딩, 퍼즐 (카운트다운 게임) 등에 적용해봤습니다.

  • 수학: 복잡한 수학 문제에서 기존 AI 보다 훨씬 높은 정확도를 보였습니다. 특히, "이 문제는 어렵네"라고 판단되면 **더 많은 시간 (계산 단계)**을 들여 점토를 더 정교하게 다듬어 정답을 냈습니다.
  • 코딩 & 퍼즐: 여러 가지 해결책을 동시에 찾아내는 능력이 뛰어나, 기존 방식보다 훨씬 창의적인 코드를 작성하거나 퍼즐을 풀었습니다.

📝 요약

**라디르 (LaDiR)**는 AI 가 문제를 풀 때, **"한 글자씩 써나가는 기계"**가 아니라 **"점토를 빚어 논리를 완성하는 예술가"**가 되게 만든 기술입니다.

  • 기존: 실수하면 고치기 어렵고, 같은 생각만 반복함.
  • 라디르: 점토 (잠재 의미) 를 반복해서 다듬어 실수를 고치고, 여러 가지 길을 동시에 탐색하여 더 정확하고 창의적인 답을 찾아냄.

이 기술은 AI 가 단순히 말만 잘하는 것을 넘어, 진짜로 깊이 있게 생각하고 추론하는 능력을 갖게 해주는 새로운 시대를 열었습니다.