A Novel Hierarchical Multi-Agent System for Payments Using LLMs

이 논문은 기존 LLM 기반 에이전트들이 해결하지 못했던 결제 업무의 자동화 과제를 해결하기 위해, 대화형 결제 에이전트부터 감독 및 라우팅 에이전트까지의 계층적 구조를 통해 종단 간 결제 워크플로우를 구현한 최초의 다중 에이전트 시스템인 HMASP 를 제안하고 그 타당성을 입증합니다.

Joon Kiat Chua, Donghao Huang, Zhaoxia Wang

게시일 2026-03-02
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 "대형 언어 모델 (LLM, AI)"이 이제부터 쇼핑을 할 때, 직접 결제를 완료할 수 있게 해주는 새로운 시스템을 소개합니다.

기존의 AI 는 "이거 사줘"라고 말하면 장바구니에 담는 것까지는 해줬지만, "결제를 해줘"라고 하면 막혀버렸습니다. 왜냐하면 결제는 보안이 매우 엄격하고, AI 가 실수 (환각) 를 하면 큰 문제가 되기 때문입니다.

이 문제를 해결하기 위해 싱가포르 관리대학과 마스터카드 연구팀이 **'HMASP(결제용 계층형 다중 에이전트 시스템)'**라는 새로운 시스템을 개발했습니다.

이 시스템을 이해하기 쉽게 고급 레스토랑의 주방에 비유해서 설명해 드릴게요.


🍽️ 비유: 결제 시스템은 '고급 레스토랑'과 같습니다

이 시스템은 한 명의 AI 가 모든 일을 하는 게 아니라, 서로 다른 역할을 가진 여러 명의 AI 직원들이 팀을 이루어 작동합니다.

1. 메인 컨시어지 (CPA - 대화형 결제 에이전트)

  • 역할: 레스토랑의 메인 도어맨이자 접수원입니다.
  • 일: 손님이 들어오면 ("저기, 결제하고 싶어요") 가장 먼저 맞습니다. 손님의 요청이 진짜 결제와 관련된 건지, 아니면 농담인지 ("농담 좀 해줘") 구분합니다.
  • 특징: 모든 요청은 이 사람이 먼저 받아서, 적절한 부서로 넘겨줍니다.

2. 부서장 (Supervisor Agent)

  • 역할: 식당 내의 각 부서장들입니다 (예: 카드 등록 팀장, 카드 조회 팀장).
  • 일: 메인 컨시어지가 "카드 등록 요청이 왔어요"라고 하면, 카드 등록 부서장에게 넘깁니다. 부서장은 "이 요청이 우리 팀 일이 맞나?"를 다시 한번 확인하고, 구체적인 담당자에게 지시합니다.

3. 실무 담당자 (Routing Agent)

  • 역할: 실제 작업을 하는 요리사들입니다.
  • 일: 부서장의 지시를 받고, 구체적인 작업 (예: 3D-secure 인증, 카드 정보 입력) 을 시작합니다. 만약 요청이 엉뚱하다면 여기서 멈추고 거절합니다.

4. 보고서 작성자 (Process Summary Agent)

  • 역할: 작업 완료 후 결과를 정리하는 스태프입니다.
  • 일: "카드 등록 성공!", "결제 실패 (이유: 정보 오류)" 같은 결과를 정리해서 다시 위로 (부서장 → 컨시어지) 전달합니다.

🔒 이 시스템의 핵심 기술 (왜 안전한가요?)

기존 AI 는 "내가 결제할게"라고 말하면서 실수로 가짜 카드 번호를 만들어내거나 (환각), 민감한 정보를 유출할 위험이 있었습니다. 하지만 이 시스템은 다음과 같은 안전 장치를 썼습니다.

  1. 정보의 분리 (장부 관리):

    • 각 직원 (에이전트) 은 자신의 업무만 볼 수 있는 장부를 가집니다. 결제 담당자는 카드 번호만 보고, 카드 등록 담당자는 다른 정보는 못 봅니다.
    • 하지만 **필요한 정보 (예: 사용자 ID)**는 공유 장부에 적어서 팀원들이 서로 알 수 있게 합니다. 이렇게 하면 불필요한 정보가 섞여 유출되는 것을 막습니다.
  2. 사람의 개입 (Interrupt - 인간이 확인하는 단계):

    • AI 가 결정을 내리기 전에, 반드시 사람이 직접 정보를 입력하게 합니다.
    • 예를 들어, "카드 번호를 입력해주세요"라고 AI 가 말하면, AI 는 멈추고 사람이 직접 숫자를 입력합니다. AI 가 임의로 숫자를 만들어내지 못하게 막는 것입니다.
  3. 확실한 기록 (상태 변수):

    • 중요한 정보는 AI 가 "기억"하는 게 아니라, 시스템의 확실한 장부에 저장합니다. AI 가 망각하거나 헛소리를 해도, 장부에 적힌 사실대로 처리되므로 안전합니다.

📊 실험 결과: 잘 작동할까요?

연구팀은 이 시스템을 다양한 AI 모델 (오픈소스 모델과 GPT-4.1 같은 유료 모델) 로 테스트했습니다.

  • 성공: 시스템이 잘 작동했습니다. 특히 Qwen2.5:32b라는 오픈소스 모델이 GPT-4.1 과 거의 비슷한 성능을 보여주었습니다.
  • 의미: 비싼 유료 AI 가 아니더라도, 이 시스템을 잘 설계하면 무료나 저렴한 오픈소스 AI 로도 안전한 결제 자동화가 가능하다는 것을 증명했습니다.
  • 최초 기록: 이 논문은 **"AI 가 자연어로 대화하며 끝까지 결제를 완료하는 첫 번째 시스템"**이라고 주장합니다.

💡 결론

이 논문은 **"AI 가 쇼핑을 끝까지 도와주는 시대"**가 왔음을 보여줍니다. 하지만 AI 가 무작정 결제하는 게 아니라, 여러 명의 AI 직원이 서로 역할을 나누고, 사람이 중요한 단계에서 확인하며, 정보를 안전하게 분리하는 시스템을 만들면, AI 결제가 현실화될 수 있다는 것을 증명했습니다.

앞으로 우리가 "AI, 이거 사주고 결제해줘"라고 말하면, AI 가 장바구니에 담고, 보안 확인을 거쳐, 우리가 직접 비밀번호만 입력하면 결제가 완료되는 세상이 올 수 있다는 희망을 줍니다.