Tracing Pharmacological Knowledge In Large Language Models

이 논문은 인과적 및 프로빙 기반 해석 기법을 활용하여 Llama 기반 생의학 언어 모델에서 약물군 지식이 단일 토큰이 아닌 분산된 표현으로 인코딩되며, 특히 중간 토큰과 합계 풀링된 표현에서 가장 강력하게 나타남을 규명했습니다.

Basil Hasan Khwaja, Dylan Chen, Guntas Toor, Anastasiya Kuznetsova

게시일 2026-03-05
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 "거대 언어 모델 (LLM) 이 약학 지식을 어떻게 머릿속에 저장하고 있는지" 그 비밀을 파헤친 연구입니다.

쉽게 말해, "인공지능이 약에 대해 얼마나 잘 알고 있을까?"라는 질문은 많이 했지만, **"그 지식이 인공지능의 뇌 (모델) 의 어느 부위에, 어떻게 저장되어 있을까?"**를 과학적으로 분석한 첫 번째 시도라고 보시면 됩니다.

이 연구의 핵심 내용을 일상적인 비유로 설명해 드릴게요.


1. 연구의 배경: AI 는 약을 잘 아는데, '어떻게' 아는지 모른다?

최근 AI 는 의약학 분야에서 놀라운 성과를 내고 있습니다. "이 약은 어떤 종류인가요?"라는 질문에 정확히 답하거나, 새로운 약을 개발하는 데 도움을 주기도 하죠.
하지만 문제는 AI 가 그 지식을 어떻게 처리하는지 우리가 모른다는 것입니다. 마치 훌륭한 요리사가 요리를 잘 만들지만, 그가 어떤 재료를 어떤 순서로 섞는지 그 비법을 알려주지 않는 것과 같습니다. 이 연구는 그 '비밀 레시피'를 찾아내는 작업입니다.

2. 실험 방법: AI 의 뇌에 '수술'을 가하다

연구진은 두 가지 흥미로운 방법을 썼습니다.

① 활성화 패칭 (Activation Patching): "AI 의 기억을 교체해보다"

이건 마치 AI 의 뇌를 잠시 꺼내서, 특정 부위의 기억을 다른 것으로 바꿔보는 실험입니다.

  • 상황: AI 에게 "에르고타민은 어떤 약인가?"라고 물으면, AI 는 "혈관수축제"라고 답합니다.
  • 실험: 연구진은 AI 가 "기관지수축제"라고 생각하도록 상황을 바꾼 뒤, AI 의 뇌 (모델의 특정 층) 에서 원래의 기억 (혈관수축제 관련 정보) 을 가져와서 끼워 넣었습니다.
  • 결과: 그랬더니 AI 가 다시 "혈관수축제"라고 답했습니다. 즉, 특정 정보가 AI 의 뇌 어디에 저장되어 있는지 정확히 찾아낸 것입니다.

② 선형 프로빙 (Linear Probing): "AI 의 생각을 읽어내다"

AI 가 약에 대해 생각할 때, 그 정보가 단어 하나에 쏠려 있는지, 아니면 여러 단어가 합쳐져서 존재하는지 확인하는 방법입니다.


3. 놀라운 발견 3 가지

이 연구에서 밝혀낸 세 가지 핵심 사실은 다음과 같습니다.

① 약에 대한 지식은 '초반부'에 저장되어 있다

기존에 AI 가 사실을 기억할 때는 문장의 마지막 단어가 가장 중요하다고 알려졌습니다. 하지만 약학 지식은 달랐습니다.

  • 비유: 문장을 읽을 때, 마지막에 "약"이라는 단어가 나오기 전에, 중간중간에 나오는 약 이름들이 AI 의 뇌에서 가장 활발하게 움직이며 지식을 저장하고 있었습니다.
  • 의미: AI 는 약에 대한 정보를 문장의 끝까지 기다리지 않고, **초반 단계 (모델의 초기 층)**에서 이미 파악하고 있다는 뜻입니다.

② 지식은 '한곳'이 아니라 '퍼져' 있다

약의 종류 (예: 진통제, 항생제) 에 대한 정보는 AI 의 뇌에서 단 하나의 단어에 꽂혀 있는 게 아니라, 여러 단어가 합쳐진 형태로 퍼져 있었습니다.

  • 비유: 약에 대한 지식이 "한 장의 메모"에 적혀 있는 게 아니라, 여러 장의 메모를 한데 모아서 (합산) 비로소 의미가 통하는 식입니다.
  • 결과: AI 가 약의 종류를 정확히 분류하려면, 문장 전체의 정보를 모아야지, 특정 단어 하나만으로는 부족했습니다.

③ 지식은 '입구'에서 이미 준비되어 있다

가장 놀라운 점은, AI 가 문장을 처리하기 **시작하기 전 (단어를 입력받는 순간)**에도 약에 대한 정보가 이미 준비되어 있었다는 것입니다.

  • 비유: AI 가 책을 읽기 시작하기 전에, 책장에 꽂힌 책들의 제목만 봐도 "아, 이건 의학책이구나"라고 알 수 있는 것처럼, 단순히 단어를 나열하기만 해도 AI 는 이미 약학적인 맥락을 파악하고 있었습니다.

4. 이 연구가 왜 중요한가?

이 연구는 AI 가 단순히 "통계적으로 맞추는" 기계가 아니라, 약학이라는 복잡한 지식을 체계적으로 이해하고 저장하고 있음을 증명했습니다.

  • 신뢰성: AI 가 왜 그런 답을 냈는지 그 이유를 설명할 수 있게 되어, 의료 현장에서 AI 를 더 신뢰하고 사용할 수 있게 됩니다.
  • 안전: AI 가 잘못된 정보를 줄 때, 그 정보가 어디서 잘못되었는지 찾아서 고칠 수 있는 길을 열었습니다.

요약

이 논문은 **"AI 가 약에 대해 아는 지식은 문장 끝이 아니라 초반에, 그리고 여러 단어가 합쳐진 형태로 저장되어 있다"**는 것을 밝혀냈습니다. 마치 AI 가 약에 대한 지식을 '한 줄의 메모'가 아니라, 뇌 전체에 퍼진 '분산된 네트워크'로 이해하고 있다는 것을 발견한 셈입니다.

이제 우리는 AI 가 어떻게 생각하는지 조금 더 잘 이해하게 되었으니, 앞으로 더 안전하고 똑똑한 의료용 AI 를 만들 수 있는 발판을 마련한 것입니다.