Knowledge-informed Bidding with Dual-process Control for Online Advertising

이 논문은 온라인 광고 입찰 최적화를 위해 인간의 전문 지식을 인ductive bias 로 통합하고, Decision Transformer 를 활용한 전역 최적화와 PID 기반의 빠른 규칙 시스템 (System 1) 과 DT 기반의 느린 추론 시스템 (System 2) 을 결합한 이중 프로세스 제어 방식인 KBD 를 제안하여 기존 블랙박스 모델의 한계를 극복하고 데이터 희소성 및 분포 외 상황에서의 적응력을 향상시켰음을 보여줍니다.

Huixiang Luo, Longyu Gao, Yaqi Liu, Qianqian Chen, Pingchun Huang, Tianning Li

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **온라인 광고 입찰 (Bidding)**을 더 똑똑하고 효율적으로 만드는 새로운 방법인 KBD를 소개합니다.

기존의 인공지능 (AI) 광고 시스템은 마치 "과거의 데이터만 보고 기계적으로 입찰하는 로봇"처럼 행동했습니다. 하지만 이 로봇은 예상치 못한 상황 (예: 갑자기 신제품이 출시되거나 대형 세일이 열릴 때) 에 당황하거나, 장기적인 이익보다는 당장의 이익만 쫓는 실수를 저지르곤 했습니다.

이 문제를 해결하기 위해 제안된 KBD는 인간의 사고 방식을 모방한 두 가지 시스템을 함께 작동시킵니다. 이를 이해하기 쉽게 **'유능한 마케팅 팀장'과 '신속한 현장 관리자'**의 협업으로 비유해 보겠습니다.


1. 문제: 왜 기존 AI 는 부족할까요?

기존 AI 는 과거 데이터를 기반으로 "어떤 광고를 얼마나 비싸게 사야 할까?"를 계산합니다. 하지만 두 가지 큰 약점이 있습니다.

  • 데이터가 부족할 때: 새로운 제품이나 예상치 못한 상황에서는 과거 데이터가 없으니 AI 는 막막해집니다.
  • 눈앞의 이익만 쫓음: 오늘 광고를 많이 보여줘서 당장 매출을 올리는 데만 집중하다 보니, 내일 예산이 바닥나서 광고가 멈추는 실수를 합니다.

2. 해결책: KBD (지식 기반의 이중 시스템)

KBD 는 하루를 두 단계로 나누어 광고를 관리합니다.

1 단계: 거시적 전략 (Macro Stage) - "유능한 마케팅 팀장 (IEFormer)"

  • 역할: 하루 전체의 큰 그림을 그립니다. "오늘은 총 100 만 원의 예산을 써야 하는데, 이걸 어떻게 하루 종일 고르게 쓸까?"를 결정합니다.
  • 특이점 (지식 기반): 이 팀장은 단순히 데이터만 보는 게 아니라, **사람 전문가의 경험 (지식)**을 학습에 직접 섞어 넣습니다.
    • 비유: "광고 비용이 늘어날수록 효율은 점점 떨어진다"는 상식 (한계효용 체감 법칙) 을 AI 에게 가르쳐서, AI 가 엉뚱한 방향으로 나가는 것을 막습니다.
    • 결과: 데이터가 부족한 상황에서도 전문가의 경험 덕분에 안정적인 '기본 입찰 가격'을 설정합니다.

2 단계: 미시적 조절 (Micro Stage) - "신속한 현장 관리자 (Dual-Process Control)"

  • 역할: 팀장이 정한 기본 계획을 바탕으로, **매 시간 (Hourly)**마다 실시간으로 입찰 금액을 미세하게 조정합니다.

  • 두 명의 조력자 (이중 시스템):

    1. 시스템 1 (PID 제어기 - '경험 많은 베테랑'):
      • 매우 빠르고 단순한 규칙을 따릅니다. "지금 예산을 너무 빨리 쓰면? → 입찰을 줄여라!" "예산이 너무 안 쓰이면? → 입찰을 늘려라!"
      • 비유: 마치 운전할 때 브레이크와 액셀을 발로 즉각적으로 조절하는 반사 신경과 같습니다.
    2. 시스템 2 (Decision Transformer - '고려 깊은 전략가'):
      • 복잡한 AI 모델로, "지금 입찰을 어떻게 해야 24 시간 뒤까지 가장 많은 매출을 낼까?"를 계산합니다.
      • 비유: 미래의 교통 상황을 예측하고 최적의 경로를 찾는 내비게이션과 같습니다.
  • 협업 방식:

    • 평상시에는 **전략가 (시스템 2)**가 주도하여 복잡한 상황을 분석하고 최적의 입찰을 결정합니다.
    • 하지만 **예상치 못한 상황 (데이터가 급변할 때)**이나 전략가가 혼란스러울 때, **베테랑 (시스템 1)**이 개입하여 "안전하게" 입찰을 조절합니다.
    • 비유: 운전 중 갑자기 눈이 쏟아지면 (예상치 못한 상황), 내비게이션 (전략가) 이 길을 잃을 수 있으니, 운전자의 **반사 신경 (베테랑)**이 브레이크를 잡는 것과 같습니다.

3. 실제 효과

이 방법을 실제 광고 플랫폼 (알리바바 헬스 등) 에서 테스트한 결과:

  • 더 많은 매출 (GMV): 기존 방법보다 광고 예산을 더 효율적으로 써서 매출을 늘렸습니다.
  • 예산 준수: 예산을 너무 일찍 다 써버리거나, 아예 안 쓰는 실수를 줄였습니다.
  • 강인함: 신제품 출시나 대형 세일 같은 급변하는 상황에서도 시스템이 무너지지 않고 안정적으로 작동했습니다.

요약

이 논문은 **"AI 가 과거 데이터만 맹신하지 않고, 인간의 전문가 지식을 배우고 (팀장), 상황에 따라 빠른 반사 신경과 깊은 사고력을 오가며 (이중 시스템) 입찰을 조절한다"**는 아이디어입니다.

마치 유능한 팀장이 장기 계획을 세우고, 현장 관리자가 실시간으로 상황에 맞춰 유연하게 대응하는 팀처럼 작동하여, 광고 입찰을 더 똑똑하고 안전하게 만드는 것입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →