Classifier or Prompt: A Case Study on Legal Requirements Traceability

Each language version is independently generated for its own context, not a direct translation.

📚 배경: 왜 이 일이 어려운가요?

소프트웨어 개발자들은 "앱에서 사용자의 데이터를 어떻게 처리할까?"라고 생각할 때, GDPR(유럽 개인정보 보호법) 같은 복잡한 법률 조항을 찾아봐야 합니다.

하지만 문제는 언어의 장벽입니다.

법률가는 "데이터 주체의 동의 없이 수집하지 말라"처럼 어렵고 추상적인 말을 씁니다.
개발자는 "로그인 시 비밀번호를 암호화하라"처럼 구체적이고 기술적인 말을 씁니다.

이 두 언어는 완전히 다릅니다. 마치 한 사람은 라틴어로, 다른 한 사람은 코딩 언어로 대화하는 것과 비슷해서, 사람이 일일이 연결해 주려면 엄청난 노력이 필요합니다.

🤖 두 가지 새로운 해결책 (비서)

저자들은 이 문제를 해결하기 위해 두 가지 AI 비서를 개발했습니다.

1. 카시프 (Kashif): "엄격한 도서관 사서"

방식: 이 비서는 문장 간의 의미 유사성을 계산합니다. "이 문장과 저 문장이 뜻이 비슷하니까 연결하자!"라고 판단합니다.
특징:
- 미리 학습된 모델 (Sentence Transformers) 을 사용해서, 단어의 겉모습이 달라도 뜻이 통하면 연결해 줍니다.
- 장점: 기존에 있던 다른 방법들보다 훨씬 정확했습니다. (기존 방법들이 40% 정도만 맞추는데, 카시프는 63% 를 맞췄습니다.)
- 단점: 하지만 너무 복잡한 새로운 법률 (GDPR) 이 나오면, "이건 내 공부한 범위 밖이야"라고 하며 연결을 잘 못합니다. (정확도가 15% 로 떨어짐)

2. 라이스 LRT (Rice LRT): "똑똑한 법률 전문가"

방식: 이 비서는 최신 **거대 언어 모델 (GPT-4o)**을 사용합니다. 단순히 문장을 비교하는 게 아니라, 사람처럼 생각하게 (Reasoning) 만듭니다.
비유: 카시프가 "단어 수가 비슷하니 연결하자"라고 한다면, 라이스 LRT 는 **"이 기능이 사용자의 개인정보를 다루는 거니까, '동의' 관련 법규를 적용해야겠네"**라고 이유를 붙여서 연결합니다.
특징:
- 프롬프트 엔지니어링 (명령어 설계): AI 에게 "너는 법률 전문가야. 이 요구사항을 보고 어떤 법규가 필요한지 이유를 설명해 줘"라고 아주 구체적으로 지시합니다.
- 성공: 이 방법은 카시프보다 훨씬 강력했습니다. 복잡한 GDPR 데이터에서도 84% 의 연결을 찾아냈고, 인간이 일일이 확인해야 할 양을 90% 이상 줄여주었습니다.

📊 실험 결과: 누가 이겼을까?

연구팀은 두 가지 데이터셋으로 실험을 했습니다.

HIPAA (미국 의료법): 비교적 단순한 데이터입니다.
- 승자: **카시프 (Kashif)**가 이겼습니다. 의미 유사성만으로도 충분히 잘 작동했습니다.
GDPR (유럽 개인정보보호법): 훨씬 복잡하고 다양한 데이터입니다.
- 승자: **라이스 LRT (Rice LRT)**가 압도적으로 이겼습니다.
- 이유: 법률과 기술 용어 사이의 간극을 **이해 (이해력)**하고, **유추 (Reasoning)**할 수 있는 AI 의 능력이 필요했기 때문입니다.

💡 핵심 교훈 (일상적인 비유로)

이 논문의 결론은 다음과 같습니다.

"단순한 단어 매칭 (카시프) 은 간단한 문제엔 좋지만, 복잡한 법률 같은 뉘앙스가 중요한 문제엔 '생각하는 AI (라이스 LRT)'가 필요합니다."

마치 **단순한 검색 엔진 (카시프)**은 키워드가 맞으면 결과를 보여주지만, **유능한 법률 상담사 (라이스 LRT)**는 질문의 맥락을 이해하고 "왜 이 법이 필요한지"까지 설명해 주는 것과 같습니다.

결론적으로:
소프트웨어가 법을 지키도록 하려면, 단순히 키워드를 찾는 것보다 법률의 맥락을 이해하고 추론할 수 있는 AI를 사용하는 것이 훨씬 효과적이며, 개발자의 시간을 크게 절약해 줄 수 있다는 것을 증명했습니다.

Classifier or Prompt: A Case Study on Legal Requirements Traceability

📚 배경: 왜 이 일이 어려운가요?

🤖 두 가지 새로운 해결책 (비서)

1. 카시프 (Kashif): "엄격한 도서관 사서"

2. 라이스 LRT (Rice LRT): "똑똑한 법률 전문가"

📊 실험 결과: 누가 이겼을까?

💡 핵심 교훈 (일상적인 비유로)

1. 문제 정의 (Problem Statement)

2. 제안된 방법론 (Methodology)

A. Kashif (분류기 기반 접근)

B. Rice LRT (프롬프트 엔지니어링 기반 접근)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

A. 벤치마크 데이터셋 (HIPAA) 에서의 Kashif 성능

B. 복잡한 데이터셋 (GDPR) 에서의 Rice LRT vs Kashif

5. 의의 및 결론 (Significance & Conclusion)

Classifier or Prompt: A Case Study on Legal Requirements Traceability

📚 배경: 왜 이 일이 어려운가요?

🤖 두 가지 새로운 해결책 (비서)

1. 카시프 (Kashif): "엄격한 도서관 사서"

2. 라이스 LRT (Rice LRT): "똑똑한 법률 전문가"

📊 실험 결과: 누가 이겼을까?

💡 핵심 교훈 (일상적인 비유로)

1. 문제 정의 (Problem Statement)

2. 제안된 방법론 (Methodology)

A. Kashif (분류기 기반 접근)

B. Rice LRT (프롬프트 엔지니어링 기반 접근)

3. 주요 기여 (Key Contributions)

4. 실험 결과 (Results)

A. 벤치마크 데이터셋 (HIPAA) 에서의 Kashif 성능

B. 복잡한 데이터셋 (GDPR) 에서의 Rice LRT vs Kashif

5. 의의 및 결론 (Significance & Conclusion)

유사한 논문

Model2Kernel: Model-Aware Symbolic Execution For Safe CUDA Kernels

Algorithmic Barriers to Detecting and Repairing Structural Overspecification in Adaptive Data-Structure Selection

Zero-Cost NDV Estimation from Columnar File Metadata

Persistence-based topological optimization: a survey

Multi-LLM Query Optimization