Towards Trustworthy Legal AI through LLM Agents and Formal Reasoning

이 논문은 LLM 에이전트와 SMT 기반 검증이 결합된 'L4L' 프레임워크를 제안하여, 자연어의 유연성과 기호 논리의 엄밀함을 융합함으로써 법적 AI 의 신뢰성과 검증 가능한 논리적 근거를 확보하는 방법을 제시합니다.

Linze Chen, Yufan Cai, Zhe Hou, Jin Song Dong

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"법률 인공지능 (AI) 을 어떻게 하면 믿을 수 있고, 오류가 없으며, 논리적으로 검증 가능한 상태로 만들 수 있을까?"**라는 질문에 대한 해답을 제시합니다.

기존의 AI 는 법률 문서를 읽고 요약하는 데는 뛰어나지만, "왜 그렇게 판결했는지"에 대한 논리적 근거를 검증할 수 없거나, 사실과 다른 내용을 만들어내는 (할루시네이션) 문제가 있었습니다.

이 논문에서 제안한 **'L4L'**이라는 새로운 시스템을 한 편의 법정 드라마에 비유하여 쉽게 설명해 드리겠습니다.


🎭 L4L: "논리 검사관"이 있는 스마트 법정

이 시스템은 단순히 AI 가 판결을 내리는 것이 아니라, 세 명의 역할이 나뉜 AI 팀이 협력하고, 마지막에 엄격한 논리 검사관이 모든 것을 확인하는 구조입니다.

1. 역할이 나뉜 AI 변호사들 (검사 vs 변호인)

일반적인 AI 는 한쪽 입장만 보고 결론을 내리기 쉽습니다. 하지만 L4L 은 두 명의 AI 변호사를 투입합니다.

  • AI 검사: 피고인을 유죄로 만들기 위해 가능한 모든 법 조항과 불리한 사실을 찾아냅니다. ("이건 중범죄야!")
  • AI 변호인: 피고인을 무죄로 만들기 위해 유죄 조항을 피하고, 감경 사유를 찾아냅니다. ("아니요, 이건 경미한 사안이에요.")

비유: 마치 TV 법정 드라마처럼, 양쪽이 서로 치열하게 다투며 사실을 정리합니다. 하지만 여기서 중요한 건, 두 변호사가 서로 다른 편견을 가지고 있어도, 나중에 나오는 공통된 규칙을 따르도록 설계되었다는 점입니다.

2. "법률 번역기"와 "논리 검사관" (SMT 솔버)

두 변호사가 주장한 내용을 그대로 받아들이지 않습니다.

  • 자동 번역기: 변호사들이 쓴 복잡한 법률 용어와 사실 관계를, 컴퓨터가 계산할 수 있는 **엄격한 수학적 논리 (코드)**로 번역합니다.
  • 논리 검사관 (SMT 솔버): 이 번역된 논리가 실제 법전과 모순되지 않는지를 수학적으로 100% 검증합니다.
    • "약 10g 을 팔았다"고 주장했는데, 법전에는 "20g 이상이어야 중죄"라고 되어 있다면? 검사관은 "틀렸습니다"라고 즉시 차단합니다.
    • AI 가 "이 법조항이 적용된다"고 말해도, 논리적으로 맞지 않으면 절대 판결에 반영되지 않습니다.

비유: 두 변호사가 "이건 A 법을 위반했다!"라고 외쳐도, 논리 검사관이 "아니야, A 법은 B 조건이 충족되어야 적용돼. 너는 조건을 안 맞췄어. 다시 해!"라고 엄격하게 검열하는 역할을 합니다.

3. "판사" AI: 최종 판결문 작성

논리 검사관이 "이 주장은 논리적으로 맞다"고 승인한 내용만 최종 판사 AI 에게 전달됩니다.

  • 판사 AI 는 검증된 논리 결과를 바탕으로, 실제 법원 판결문처럼 이유가 명확하고 설득력 있는 판결문을 작성합니다.
  • 이때 과거의 비슷한 판례 (선례) 를 참고하여, 법이 가진 유연한 해석까지 더합니다.

비유: 논리 검사관이 "이건 안전하다"고 도장을 찍은 재료만 가지고, **명장 (판사)**이 최고의 요리를 만들어내는 것과 같습니다.


🌟 왜 이 방식이 특별한가요? (핵심 장점)

  1. 거짓말을 못 합니다 (검증 가능성):

    • 기존 AI 는 "내가 생각하기에 이 법이 적용되는 것 같아"라고 막연하게 말할 수 있습니다.
    • L4L 은 "이 법이 적용된다는 수학적 증명이 있다"고 말합니다. 만약 증명 과정에 오류가 있으면, 시스템이 스스로 "오류가 있다"고 알려줍니다.
  2. 공정한 경쟁 (적대적 학습):

    • 검사와 변호인 AI 가 서로 싸우게 함으로써, 한쪽의 편향된 주장을 걸러내고 사실 관계를 더 정확하게 파악합니다.
  3. 법적 근거가 명확합니다:

    • "왜 이 사람이 1 년 형을 받았나요?"라고 물으면, AI 는 "법률 제 347 조와 2016 년 해석 8 호에 따라, 약물의 양이 6g 이기 때문에..."라고 수치와 조항을 들어 명확하게 설명할 수 있습니다.

💡 결론: "믿을 수 있는 법률 AI"의 탄생

이 논문은 **"AI 가 법을 판단할 때, 인간의 직관이나 감이 아니라, 수학적으로 검증된 논리가 중심이 되어야 한다"**는 것을 보여줍니다.

마치 **스마트한 비서 (LLM)**가 법전을 읽고 초안을 작성하면, **엄격한 감사관 (논리 솔버)**이 모든 숫자와 조건을 다시 계산하여 오류를 잡은 뒤, 경험 많은 판사가 최종 결정을 내리는 시스템입니다.

이 way 로만 AI 가 법정에 서도 **"이 판결은 논리적으로 완벽하게 검증되었습니다"**라고 자신 있게 말할 수 있게 되는 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →