3BASiL: An Algorithmic Framework for Sparse plus Low-Rank Compression of LLMs

이 논문은 LLM 의 가중치를 희소 행렬과 저랭크 행렬의 합으로 분해하는 효율적인 원샷 후학습 방법인 3BASiL-TM 을 제안하여, 기존 방법 대비 성능 저하를 크게 줄이고 압축 속도를 2.5 배 이상 향상시켰음을 보여줍니다.

Mehdi Makni, Xiang Meng, Rahul Mazumder

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

📚 배경: 거대한 도서관의 문제

현재의 최신 인공지능 (LLM) 은 방대한 지식과 능력을 가진 거대한 도서관과 같습니다. 하지만 이 도서관은 너무 커서:

  1. 공간을 너무 많이 차지합니다. (메모리 부족)
  2. 책을 찾는 데 시간이 너무 걸립니다. (연산 속도 느림)
  3. 작은 책방 (스마트폰 등) 에는 들어갈 수 없습니다.

그래서 우리는 이 도서관의 내용을 잃지 않으면서, 책장을 줄이고 (압축) 더 효율적으로 만들 필요가 있습니다.

🛠️ 기존 방법의 한계: "잘라내기"와 "요약하기"

지금까지의 방법들은 주로 두 가지 방식을 섞어 썼습니다.

  1. 가지치기 (Pruning): 쓸모없는 책 (중요하지 않은 단어) 을 버리는 것.
  2. 요약 (Low-Rank): 긴 내용을 짧은 요약본으로 만드는 것.

하지만 기존 방법들은 이 두 가지를 순서대로 처리했습니다. 먼저 불필요한 책을 버리고, 그다음에 남은 내용을 요약했습니다. 문제는 이 과정에서 도서관의 원래 분위기 (정확도) 가 많이 망가진다는 점입니다. 마치 책을 무작위로 잘라내다 보니 중요한 줄거리가 끊겨버리는 것과 비슷합니다.

✨ 새로운 해결책: 3BASiL (3-Block ADMM)

이 논문은 "가지치기와 요약을 동시에, 그리고 더 똑똑하게" 하는 방법을 제안합니다.

1. 3BASiL: "동시 작업의 마법"

기존에는 "버리고 나서 요약"이었다면, 3BASiL 은 **"버릴 책과 요약할 내용을 한 번에 계산해서 결정"**합니다.

  • 비유: 도서관 사서가 책장을 정리할 때, "이 책은 버려야지"라고 생각하다가 "아, 이걸 요약하면 되겠네"라고 다시 생각하는 게 아니라, 한 번의 작업으로 "이 책은 버리고, 저 책은 요약본으로 대체하자"라고 동시에 최적의 조합을 찾아냅니다.
  • 결과: 도서관의 원래 내용 (정확도) 을 훨씬 더 잘 보존하면서도 크기를 줄일 수 있습니다.

2. TM (Transformer Matching): "전체 흐름 확인하기"

층층이 쌓인 책장 (레이어) 을 하나씩 정리하다 보면, 앞쪽 책장을 정리할 때 실수가 뒤쪽 책장에 영향을 미쳐 전체 흐름이 깨질 수 있습니다.

  • 비유: 3BASiL 로 책을 정리한 후, 전체 도서관의 흐름을 다시 한번 훑어보는 (Transformer Matching) 과정을 거칩니다.
  • 효과: "아, 앞쪽에서 버린 책 때문에 뒤쪽의 이야기가 어색해졌네? 조금만 수정하자"라고 전체적인 맥락을 맞춰줍니다. 이 과정은 기존에 없던 새로운 기술로, 어떤 방식의 정리법에도 적용할 수 있어 만능 열쇠 같은 역할을 합니다.

🚀 실제 성과: 빠르고, 정확하고, 가볍다

이론적인 설명만으로는 부족하죠? 실제 실험 결과는 어떨까요?

  1. 정확도 향상: 기존 방법들보다 30% 이상 더 정확한 결과를 냅니다. (예: 위키 텍스트 같은 책 읽기 테스트에서 훨씬 더 자연스럽게 답함)
  2. 압축 속도: 같은 작업을 하는 데 걸리는 시간이 2.5 배 이상 빨라졌습니다. (A100 그래픽 카드 기준)
  3. 유연성: 이 기술은 어떤 모델에도 적용 가능하며, 나중에 특정 작업을 위해 미세 조정 (LoRA) 을 할 때도 아주 좋은 출발점을 제공합니다.

💡 요약

이 논문은 **"거대한 AI 모델을 작게 만들 때, 단순히 자르고 요약하는 게 아니라, '버릴 것'과 '요약할 것'을 동시에 계산하고, 전체 흐름을 다시 한번 맞춰주는 똑똑한 알고리즘 (3BASiL)"**을 개발했습니다.

이 덕분에 우리는 작은 스마트폰에서도 거대한 AI 의 능력을 빠르고 정확하게 사용할 수 있는 길이 열렸습니다. 마치 거대한 도서관을 가볍고 빠른 전자책 리더기로 변환하되, 원서의 맛을 그대로 살리는 기술을 개발한 셈입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →