원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기
당신이 거대한 법률 사건을 돕기 위해 매우 똑똑하고 속도가 빠른 법대생을 고용했다고 상상해 보십시오. 이 학생은 도서관의 모든 법률 서적을 읽었으며, 몇 초 만에 완벽한 문장을 써 내려갈 수 있습니다. 하지만 당신이 그 학생에게 사건 전체를 처음부터 끝까지 처리해 달라고 요청하면, 그는 종종 작지만 결정적인 세부 사항들을 놓치곤 합니다. 마감일을 잊어버리거나, 금액을 잘못 계산하거나, 법률이 적힌 구체적인 페이지를 인용하지 못하는 식입니다.
**"파르테논 로(Parthenon Law)"**라는 이 논문은 문제가 "학생"(AI 모델)이 충분히 똑똑하지 않기 때문이 아니라고 주장합니다. 문제는 그 주변의 **업무 시스템(work system)**이 망가져 있다는 것입니다.
다음은 이들의 해결책을 쉬운 비유를 사용하여 정리한 내용입니다.
1. 문제점: "똑똑하지만 산만한 인턴"
저자들은 현존하는 가장 똑똑한 AI 모델들을 대상으로 12,510개의 실제 법률 작업(계약서 검토 또는 법원 마감일 분석 등)을 테스트했습니다.
- 결과: 가장 똑똑한 AI 모델들도 개별 질문에 대해서는 80~90%의 정답률을 보였습니다. 하지만 법률의 세계에서 90%를 맞히는 것만으로는 충분하지 않습니다. 단 하나의 마감일이나 단 하나의 인용구를 놓치더라도, 그 문서는 쓸모없게 되기 때문입니다.
- 비유: 채소를 완벽하게 다지고 스테이크를 완벽하게 시즈닝할 줄 아는 요리사를 상상해 보십시오. 하지만 그 요리사가 오븐을 켜는 것을 잊었다면, 요리는 망쳐진 것입니다. 문제는 요리사의 기술이 아니라 "오븐"(프로세스)이 없었다는 점입니다.
2. 해결책: "파르테논(Parthenon)" 프레임워크
저자들은 파르테논이라 불리는 새로운 시스템을 구축했습니다. 단순히 AI에게 "일을 하라"고 시키는 대신, AI 주변에 엄격한 6단계의 "워크숍(workshop)"을 구축한 것입니다. 이는 마치 로봇 주변에 첨단 공장 바닥을 만드는 것과 같습니다.
이 프레임워크는 세 가지 주요 부분으로 구성됩니다:
"체크리스트" (기술 및 도구):
AI가 단 한 단어를 쓰기 전, AI는 반드시 특정 도구들을 사용하도록 강제됩니다. AI는 날짜를 그냥 "추측"할 수 없습니다. 반드시 "날짜 계산기" 도구를 실행해야 합니다. AI는 단순히 "법을 찾을" 수 없습니다. 반드시 자신의 작업 과정을 보여주도록 강제하는 "검색 도구"를 사용해야 합니다.- 비유: 이는 인턴에게 "1. 달력을 확인한다. 2. 돈을 계산한다. 3. 출처를 찾는다. 4. 숫자를 검증한다"라고 적힌 체크리스트를 주는 것과 같습니다. 단계별로 건너뛸 수 없습니다.
"세 머리 달린 괴물" (해결사, 평가자, 학습자):
시스템은 작업을 서로 부정행위를 유도하지 않는 세 가지 별도의 역할로 나눕니다:- 해결사 (Solver): 실제 초안을 작성합니다.
- 평가자 (Evaluator): 작성이 끝난 후, 규칙에 따라 초안을 채점하는 별도의 "판사" 역할을 합니다.
- 학습자 (Learner): "판사"의 노트를 보고 다음번을 위해 체크리스트나 도구를 수정하는 정비공 역할을 합니다.
- 비유: 해결사는 에세이를 씁니다. 평가자는 이를 채점합니다. 학습자는 에세이를 수정하는 것이 아니라, 다음 학생이 같은 실수를 반복하지 않도록 *지침(instructions)*을 다시 작성합니다.
"부정행위 방지" 규칙 (Anti-Leakage):
이것은 매우 중요합니다. 시스템은 실수로부터 배우지만, 특정 테스트 질문의 정답을 암기하는 것은 엄격히 금지됩니다.- 비의: 만약 인턴이 수학 시험에서 낙제했다면, 시스템은 그에게 "5번 문제의 답은 42이다"라고 가르치는 것이 아니라, "나눗셈을 더 잘하는 방법"을 가르칩니다. 이를 통해 시스템은 단순히 테스트를 암기하는 것이 아니라 일반적인 능력을 키우게 됩니다.
3. 결과: "더 똑똑한 두뇌가 아닌, 더 나은 프로세스"
저자들은 파르테논 워크숍이 있는 경우와 없는 경우의 AI 모델을 동일하게 실행했습니다.
- 파르테논이 없을 때: AI는 브레이크가 없는 빠른 자동차와 같았습니다. 빠르게 달렸지만 자주 충돌했습니다.
- 파르테논이 있을 때: AI는 신뢰할 수 있는 배달 트럭이 되었습니다. 경로를 따르고, 화물을 확인하며, 안전하게 도착했습니다.
마법의 숫자: 이 프레임ка워크를 추가했을 때, 훨씬 더 비싸고 "똑똑한" AI 모델로 업그레이드했을 때와 거의 비슷한 수준으로 AI의 성능이 향-상되었습니다. 실제로, 파르테논 시스템을 갖춘 저렴한 AI 모델이 시스템이 없는 최상위 모델보다 더 나은 성능을 보였습니다.
4. 결론: "코파일럿(Co-Pilot)"
논문은 이 시스템이 인간 변호사를 대체하는 것이 아님을 결론짓습니다.
- 현실: 파르테논 시스템을 사용하더라도, AI는 여전히 아주 미세한 세부 사항에서 약 10% 정도의 오류를 범합니다.
- 역할: AI는 이제 "슈퍼 초안 작성자"입니다. AI는 90%의 힘든 일을 수행하고, 스스로의 작업을 검토하며, 남은 10%를 인간 변호사가 검토할 수 있도록 표시해 둡니다.
- 이점: 인간 변호사가 처음부터 문서를 작성하기 위해 12시간을 쓰는 대신, 이미 90% 완벽하고 실제 증거에 기반한 초안을 검토하는 데 10분만 쓰면 됩니다.
요약하자면: 파르테논은 AI를 마법처럼 "똑똑하게" 만드는 것이 아니라, AI가 추측을 멈추고 엄격하며 감사 가능한(auditable) 일련의 규칙을 따르도록 강제하는 것입니다. 이는 혼란스러운 브레인스토밍 세션을 규율 있는 법률 워크플로우로 변화시킵니다.
연구 분야의 논문에 파묻히고 계신가요?
연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.