SEGB: Self-Evolved Generative Bidding with Local Autoregressive Diffusion

이 논문은 외부 개입 없이 정적 데이터만으로 미래 상태를 예측하고 가치 기반 정책 정제를 통해 스스로 진화하여 오프라인 학습의 한계를 극복하고 온라인 광고 입찰 효율성을 획기적으로 개선한 'SEGB(Self-Evolved Generative Bidding)' 프레임워크를 제안합니다.

Yulong Gao, Wan Jiang, Mingzhe Cao, Xuepu Wang, Zeyu Pan, Haonan Yang, Ye Liu, Xin Yang

게시일 2026-02-27
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🎯 핵심 아이디어: "미래를 내다보고, 스스로 성장하는 입찰사"

기존의 광고 입찰 시스템은 마치 과거의 기록만 보고 운전하는 운전자와 같았습니다. "어제 이럴 때 이랬으니 오늘도 이렇게 해보자"라고 반응할 뿐, "앞으로 10 분 뒤에는 교통체증이 생길 텐데 미리 우회해야지"라는 선제적인 판단을 못 했습니다.

또한, 기존 시스템은 실제 경매장에 나가지 않고는 실력을 향상시킬 수 없는 한계가 있었습니다. (실제 광고를 집행하며 실패를 경험해야만 배우는 식이죠.)

SEGB는 이 두 가지 문제를 해결합니다.

  1. 미래를 예측하는 능력: "다음 10 분 뒤의 상황"을 시뮬레이션해서 미리 대비합니다.
  2. 스스로 진화하는 능력: 실제 시장에 나가지 않고도, 과거 데이터만 가지고 "어떻게 하면 더 잘할 수 있을까?"를 스스로 고민하며 실력을 업그레이드합니다.

🛠️ SEGB 가 작동하는 3 단계 (마치 요리사처럼)

이 시스템은 세 가지 핵심 기술을 조합하여 작동합니다.

1 단계: 정교한 미래 예보관 (LAD - 국소 자기회귀 확산)

  • 비유: 마치 날씨 예보관이 과거의 기온, 습도 데이터를 보고 "내일 오후 2 시에는 비가 올 것이다"라고 정확히 예측하는 것과 같습니다.
  • 기존 방식의 문제: 기존 AI 는 "내일 하루 전체 날씨"를 한 번에 뚝딱 만들어내려다 보니, "아침에는 맑다가 갑자기 밤에 폭풍이"처럼 논리적으로 어색한 예측을 하곤 했습니다. (예: 예산이 시간이 지남에 따라 늘어날 수는 없는데, AI 가 그렇게 예측함)
  • SEGB 의 해결책: LAD는 한 번에 하루 전체를 예측하는 게 아니라, "지금 이 순간"을 기준으로 "다음 1 분 뒤"를 하나씩 순서대로 예측합니다. 이렇게 하면 예산이 줄어드는 등 현실적인 규칙 (인과관계) 을 지키면서 미래 상태를 아주 정확하게 그려냅니다.

2 단계: 미래를 보고 행동하는 운전수 (Next-State-Aware DT)

  • 비유: 이제 운전수가 됩니다. 보통 운전수는 "어제 이 길로 갔더니 잘됐으니 오늘도 가자"라고 반응합니다. 하지만 SEGB 의 운전수는 예보관 (LAD) 이 준 미래 정보를 받습니다.
  • 작동 원리: "다음 1 분 뒤에는 예산이 바닥날 것 같아. 그러니까 지금 당장 입찰가를 조금 낮춰야겠다"라고 미리 계획을 세웁니다. 과거의 결과만 보고 반응하는 게 아니라, 미래의 목표를 보고 미리 행동하는 것입니다.

3 단계: 시뮬레이션 없이 스스로 실력을 키우는 훈련 (GRPO - 오프라인 정책 진화)

  • 비유: 요리사가 실제 손님 (실제 광고 시장) 을 대접하기 전, 레시피 (과거 데이터) 만 보고 "어떻게 하면 더 맛있게 만들지?"를 스스로 고민하며 레시피를 수정하는 과정입니다.
  • 기존 방식의 문제: 보통 AI 는 실전에서 실수하며 배우거나, 복잡한 시뮬레이터 (가상 게임) 를 만들어야 실력을 키웠습니다. 하지만 광고 시장은 너무 복잡해서 시뮬레이터도 정확하지 않고, 실전에서 실수하면 돈이 날아갑니다.
  • SEGB 의 해결책: GRPO라는 기술을 써서, 과거의 데이터만 가지고도 "이런 상황에서 이렇게 했다면 더 좋았을 텐데"라고 가상의 시나리오를 만들어내며 스스로 실력을 높입니다. 마치 체스 고수가 과거 명대국 데이터만 보고 스스로 새로운 전략을 개발하는 것과 같습니다.

📈 실제 성과: "돈을 더 잘 벌게 해준 AI"

이 기술이 실제로 JD.com(징둥닷컴) 에서 테스트되었을 때 어떤 결과가 나왔을까요?

  • 오프라인 테스트: 유명한 입찰 데이터셋에서 기존 최고 기술들보다 압도적으로 좋은 점수를 받았습니다. 특히, 광고 전환 횟수가 적은 (데이터가 부족한) 상황에서도 미래 예측 능력이 빛을 발하며 크게 이겼습니다.
  • 실제 온라인 테스트 (A/B 테스트): 수백억 건의 광고 요청이 들어오는 실제 환경에서 테스트했습니다.
    • 결과: 목표 비용 대비 성과가 약 10.19% 증가했습니다.
    • 의미: 같은 예산을 썼는데, 더 많은 고객에게 광고가 도달하거나 더 좋은 효과를 냈다는 뜻입니다.
    • 속도: 이 복잡한 계산이 0.0375 초 안에 끝났습니다. (100ms 이내로 요구되는 실시간 입찰 조건을 여유롭게 통과)

💡 한 줄 요약

SEGB는 **"과거 데이터를 바탕으로 미래를 정확히 예측하고, 그 예측을 바탕으로 스스로 실력을 갈고닦아, 실제 광고 경매에서 더 많은 돈을 벌어주는 똑똑한 AI 입찰사"**입니다.

이 기술은 광고주에게는 더 효율적인 마케팅을, 플랫폼에게는 더 큰 수익을 가져다주는 혁신적인 솔루션입니다.

이런 논문을 받은편지함으로 받아보세요

관심사에 맞는 일간 또는 주간 다이제스트. Gist 또는 기술 요약을 당신의 언어로.

Digest 사용해 보기 →