Efficient Compositional Multi-tasking for On-device Large Language Models

이 논문은 온디바이스 환경에서 단일 예제가 여러 작업을 동시에 수행해야 하는 복합적 멀티태스킹 문제를 해결하기 위해, 새로운 벤치마크와 효율적인 '학습 가능한 보정' 방법을 제안합니다.

Ondrej Bohdal, Mete Ozay, Jijoong Moon, Kyeng-Hun Lee, Hyeonmok Ko, Umberto Michieli

게시일 2026-03-13
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"작은 스마트폰에 들어가는 인공지능 (LLM) 이 여러 일을 한 번에 잘 해내는 방법"**에 대한 연구입니다.

기존의 인공지능은 보통 한 번에 한 가지 일만 잘하도록 훈련되었습니다. 하지만 현실에서는 "이 긴 글을 요약해서 스페인어로 번역해 줘"처럼 여러 가지 일을 동시에 해야 하는 경우가 많습니다. 이 논문은 바로 이런 **'복합적인 작업'**을 스마트폰 같은 작은 기기에서도 빠르고 효율적으로 해결하는 방법을 제안합니다.

이 내용을 이해하기 쉽게 세 가지 비유로 설명해 드릴게요.


1. 문제 상황: "한 번에 두 마리 토끼를 잡으려면?"

상상해 보세요. 당신이 **요리사 (인공지능)**를 고용했다고 칩시다.

  • 요리사 A 는 **요리 (요약)**만 잘합니다.
  • 요리사 B 는 **번역 (번역)**만 잘합니다.

이제 손님이 "이 긴 레시피를 요약해서 프랑스어로 써줘"라고 주문합니다.

  • 기존 방식 (비효율적): 요리사 A 가 먼저 요약해서 종이에 적고, 그 종이를 요리사 B 에게 넘겨서 프랑스어로 번역하게 합니다.
    • 단점: 두 번이나 일을 해야 하므로 시간이 오래 걸리고, 종이를 여러 장 써야 해서 메모리 (저장 공간) 를 많이 차지합니다.
  • 기존 기술의 한계 (모델 병합): 요리사 A 와 B 의 기술을 섞어서 새로운 요리사 C 를 만들었습니다. 하지만 이 요리사 C 는 "요리만 하거나 번역만 하거나"는 잘해도, "요리하면서 동시에 번역하는" 복잡한 주문에는 당황해서 실패합니다.

이 논문은 **"한 명의 요리사가 한 번의 작업으로 두 가지 일을 완벽하게 해낼 수 있는 방법"**을 찾았습니다.

2. 제안된 해결책: "요리사에게 '맞춤형 안경'을 씌우다"

저자들은 이미 스마트폰에 설치된 여러 가지 요리사 (요약 전문, 번역 전문 등) 들이 있다고 가정합니다. 이들을 모두 새로 만드는 건 너무 비싸고 무겁습니다.

그래서 제안한 방법은 **'Learnable Calibration (학습 가능한 보정)'**입니다.

  • 비유: 이미 잘하는 요리사 (기존 모델) 들을 한 번에 섞어서 '혼합 요리사'를 만든 뒤, 그에게 아주 작은 **'맞춤형 안경'**을 씌워주는 것입니다.
  • 작동 원리:
    1. 혼합: 요약 전문 요리사와 번역 전문 요리사의 기술을 간단히 섞습니다 (이건 기존 기술로 가능).
    2. 보정 (핵심): 섞인 요리사가 "아, 내가 두 가지 일을 동시에 하려면 이 부분에서 조금 더 집중해야겠구나"라고 깨닫게 해주는 아주 작은 **보정 파라미터 (안경)**를 학습시킵니다.
    3. 결과: 이 '안경'은 데이터 양이 매우 적어서 스마트폰 저장 공간을 거의 차지하지 않지만, 요리사가 한 번의 작업으로 요약과 번역을 동시에 완벽하게 해내도록 도와줍니다.

3. 왜 이것이 중요한가요? (실생활 예시)

이 기술이 스마트폰에 적용되면 어떤 일이 일어날까요?

  • 해외 여행 중: 친구가 보낸 긴 영어 이메일을 보고, "이 내용 요약해서 한국어로 알려줘"라고 말합니다.
    • 과거: 이메일을 요약하는 앱과 번역하는 앱을 번갈아 켜야 했거나, 서버로 보내야 해서 느리고 개인정보가 유출될 우려가 있었습니다.
    • 이제: 스마트폰 안에서 한 번에 요약과 번역이 끝납니다. 빠르고, 내 데이터는 내 기기 안에만 남습니다.

4. 이 연구의 핵심 성과

  1. 새로운 기준 (벤치마크) 마련: "요약 + 번역", "답장 + 톤 조절" 등 실제 생활에 필요한 4 가지 복합 작업을 테스트할 수 있는 기준을 만들었습니다.
  2. 효율성 극대화: 기존에 여러 번 작업을 거치던 방식 (비효율적) 과는 달리, **한 번의 작업 (Single Inference)**으로 해결하면서도 성능은 비슷하거나 더 좋습니다.
  3. 저장 공간 절약: 새로운 요리사를 만드는 게 아니라, 기존 요리사에게 아주 작은 '보정 도구'만 추가하므로 스마트폰 저장 공간을 거의 차지하지 않습니다.

요약

이 논문은 **"작은 스마트폰에서도 인공지능이 여러 일을 동시에 잘하게 하려면, 무거운 새 모델을 만드는 게 아니라, 기존 모델에 아주 작고 똑똑한 '보정 장치'를 달아주면 된다"**는 것을 증명했습니다.

이는 앞으로 우리가 스마트폰으로 복잡한 작업을 할 때, 더 빠르고, 더 편리하며, 더 안전하게 인공지능을 사용할 수 있는 길을 열어줍니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →