Ayn: A Tiny yet Competitive Indian Legal Language Model Pretrained from Scratch

이 논문은 인도 법률 도메인에서 0 에서부터 사전 학습된 88M 파라미터 규모의 소형 언어 모델 'Ayn'이 80 배까지 큰 대규모 언어 모델 (LLM) 보다 법률 사건 판결 예측에서 더 뛰어난 성능을 보이고, 요약 및 일반 작업에서도 경쟁력을 입증했다는 것을 보여줍니다.

Mitodru Niyogi, Eric Gaussier, Arnab Bhattacharya

게시일 2026-03-17
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🌟 핵심 비유: "거인 vs. 전문 마법사"

이 논문의 핵심은 **"크기가 크다고 해서 항상 좋은 건 아니다"**는 점입니다.

  • 기존의 거대 모델 (LLM): 전 세계의 모든 지식을 다 배운 거대한 도서관이나 만능 거인 같습니다. 모든 것을 알지만, 몸집이 너무 커서 움직이려면 엄청난 전기와 돈이 듭니다. 또한, 서양 (미국, 유럽) 의 법률 지식을 주로 배워서 인도 같은 다른 나라의 법을 설명할 때는 조금 어색하거나 편향될 수 있습니다.
  • AYN (새로운 모델): 인도 법전과 판례만 집중적으로 공부한 작은 전문 마법사입니다. 몸집은 작지만 (파라미터 8800 만 개), 자신이 전문으로 하는 분야에서는 거인보다 훨씬 빠르고 정확하게 답을 냅니다.

📖 이 논문이 말하려는 3 가지 중요한 이야기

1. "왜 작은 모델을 만들었나요?" (비용과 효율성)

지금까지 인공지능을 만들려면 거대한 컴퓨터 (GPU) 를 수백 시간 동안 돌려야 했고, 전기세만 수천만 원이 들었습니다. 마치 전체 세계를 여행하며 지식을 쌓으려다 지친 거인처럼요.
하지만 연구진은 **"인도 법조계만 전문으로 하면 되지 않나?"**라고 생각했습니다. 그래서 인도 대법원 판례 3 만 건과 헌법, 형법만을 모아서 작은 모델을 처음부터 (Scratch) 훈련시켰습니다.

  • 결과: 거인 (80 억 파라미터) 을 훈련시키는 데 드는 비용의 1/80 수준으로, 훨씬 적은 돈과 시간 (185 시간) 으로 모델을 만들었습니다. 탄소 배출량도 거의 없었습니다.

2. "작은 모델이 정말 거인을 이길 수 있나요?" (성능 비교)

연구진은 이 작은 모델 (AYN) 을 거대한 모델들 (Llama-3, Llama-2 등) 과 비교했습니다. 결과는 놀라웠습니다.

  • 판결 예측 (누가 이길까?):

    • 상황: 복잡한 법조문과 사건 기록을 읽고 "이 소송이 이길까, 질까?"를 예측하는 게임입니다.
    • 결과: 거인 모델들은 50% 정도 (우연히 맞히는 수준) 를 기록했지만, 작은 AYN 모델은 69% 를 기록하며 모든 거인 모델을 압도했습니다.
    • 이유: 거인 모델은 너무 많은 것을 다 배우느라 인도 법의 미묘한 뉘앙스를 놓친 반면, AYN 은 인도 법만 파고들어서 전문가처럼 생각했기 때문입니다.
  • 요약하기 (긴 글을 짧게 줄이기):

    • 상황: 2 만 자나 되는 긴 판결문을 5 천 자 정도로 요약하는 작업입니다.
    • 결과: AYN 은 30 억 파라미터짜리 모델 (거인 30 배 크기) 과 맞먹는 성능을 냈습니다. 80 억 파라미터 모델보다는 조금 뒤처졌지만, 비용 대비 성능은 압도적이었습니다.

3. "인도 법은 왜 특별한가요?" (데이터와 토크나이저)

인도 법은 영어로 쓰이지만, 서양 법과 완전히 다릅니다.

  • 문제: 일반적인 인공지능은 "hereinafter (이하)", "notwithstanding (불구하고)" 같은 법조계 특유의 어려운 단어들을 잘게 쪼개서 이해하지 못합니다. 마치 영어를 잘하는 외국인이 한자 성어를 모르고 글자를 하나씩 읽는 것과 비슷합니다.
  • 해결: 연구진은 **인도 법조계专用的인 "사전 (토크나이저)"**을 새로 만들었습니다. 이 사전은 법조문 특유의 긴 단어와 복잡한 인용문을 하나의 덩어리로 인식하게 해줍니다. 덕분에 작은 모델도 복잡한 법조문을 쉽게 이해할 수 있게 되었습니다.

🚀 이 연구가 우리에게 주는 메시지

  1. 무조건 큰 게 좋은 건 아니다: 특정 분야 (의료, 법률 등) 에서는 전문적으로 훈련된 작은 모델이 거대한 범용 모델보다 더 똑똑하고 효율적일 수 있습니다.
  2. 지역별 편향을 줄이자: 서양 중심의 거대 모델은 인도 같은 지역의 문화를 제대로 반영하지 못합니다. 현지에 맞는 작은 모델을 만드는 것이 공정한 인공지능을 만드는 길입니다.
  3. 접근성: 이 모델은 비용이 매우 저렴하고 환경에도 친화적입니다. 덕분에 돈이 부족한 개발도상국이나 작은 연구실에서도 고품질 법률 AI 를 사용할 수 있게 되었습니다.

💡 한 줄 요약

"전 세계를 다 아는 거인보다, 인도 법전만 파고든 작은 전문가가 법원에서는 더 똑똑하고, 저렴하며, 빠르다!"

이 연구는 인공지능이 거대해지는 것만 쫓지 않고, 필요한 곳에 맞는 적절한 크기의 모델을 만드는 새로운 길을 제시합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →