TransactionGPT

이 논문은 세계 최대 결제 네트워크 중 하나의 소비자 거래 데이터를 기반으로 한 새로운 3D-Transformer 아키텍처를 도입하여 이상 거래 탐지 및 미래 거래 생성 등 다양한 하위 작업에서 기존 모델보다 우수한 성능과 효율성을 입증한 'TransactionGPT'라는 거래 데이터 전용 파운데이션 모델을 제안합니다.

Yingtong Dou, Zhimeng Jiang, Tianyi Zhang, Mingzhi Hu, Zhichao Xu, Shubham Jain, Uday Singh Saini, Xiran Fan, Jiarui Sun, Menghai Pan, Junpeng Wang, Xin Dai, Liang Wang, Chin-Chia Michael Yeh, Yujie Fan, Yan Zheng, Vineeth Rakesh, Huiyuan Chen, Guanchu Wang, Mangesh Bendre, Zhongfang Zhuang, Xiaoting Li, Prince Aboagye, Vivian Lai, Minghua Xu, Hao Yang, Yiwei Cai, Mahashweta Das, Yuzhong Chen

게시일 2026-03-04
📖 4 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

비자 (Visa) 의 'TransactionGPT': 당신의 지갑을 이해하는 초지능 AI

이 논문은 세계 최대 결제 네트워크 중 하나인 비자 (Visa) 연구팀이 개발한 새로운 AI 모델, TransactionGPT(TGPT) 에 대한 이야기입니다.

기존의 AI 가 글을 쓰거나 그림을 그리는 데 뛰어나다면, 이 TGPT 는 **"사람들이 돈을 어떻게 쓰고, 어디로 이동하는지"**를 완벽하게 이해하고 예측하는 데 특화된 AI 입니다.

이 복잡한 기술을 일상적인 언어와 비유로 쉽게 설명해 드리겠습니다.


1. 왜 이런 AI 가 필요할까요? (문제 상황)

우리가 스마트폰으로 커피를 사거나, 여행 가서 호텔을 예약할 때 남기는 결제 기록은 단순한 숫자가 아닙니다.

  • 언제 (시간), 얼마 (금액), 누구와 (상점), 어디서 (위치) 샀는지 등 다양한 정보가 섞여 있습니다.

기존의 AI 모델들은 이 복잡한 정보를 처리하는 데 한계가 있었습니다.

  • **LLM(대형 언어 모델)**은 글을 잘 쓰지만, 숫자나 데이터 테이블을 다루는 데는 비효율적이고 느립니다. (마치 "수학 문제를 풀기 위해 시를 쓰는 것"과 같습니다.)
  • 기존 데이터 분석 도구는 너무 단순해서 복잡한 패턴을 놓칩니다.

비유하자면:
기존 AI 들은 "사람이 커피를 마셨다"는 사실만 알았지, "그 사람이 출근길에 급하게 커피를 사서 3 분 뒤에 회사로 갔다"는 맥락과 흐름을 이해하지 못했습니다. TGPT 는 이 **흐름 (Trajectory)**을 이해하는 새로운 뇌를 가진 AI 입니다.


2. TGPT 의 핵심 기술: 3 차원 (3D) 구조의 마법

이 모델의 가장 큰 특징은 3 차원 (3D) 아키텍처를 사용한다는 점입니다. 이를 쉽게 이해하기 위해 **'레고 조립'**에 비유해 보겠습니다.

🧱 1 차원 (1D): 시간의 흐름만 봄

단순히 "어제 커피를 마셨고, 오늘 빵을 샀다"는 시간 순서만 보는 단계입니다.

🧱 2 차원 (2D): 한 번의 거래를 자세히 봄

"커피를 산 그 순간"을 자세히 봅니다. 금액, 시간, 상점 이름 등 한 장의 영수증에 있는 모든 정보를 서로 연결해서 이해합니다.

🧱 3 차원 (3D): 시간 + 영수증 + 특수한 정보의 완벽한 조화

이것이 TGPT 의 핵심입니다. 세 가지 정보를 동시에 처리합니다.

  1. 시간 (Temporal): 과거의 소비 패턴.
  2. 메타데이터 (Metadata): 상점 이름, 카테고리 등 기본 정보.
  3. 특수 기능 (Features): 사기 탐지나 추천을 위해 만든 복잡한 계산 데이터.

💡 핵심 아이디어: '가상 토큰 (Virtual Token)'
여러 정보가 섞이면 데이터가 너무 커져서 AI 가 처리하기 힘들어집니다. TGPT 는 **'가상 토큰'**이라는 마법 같은 도구를 사용합니다.

  • 비유: 방대한 양의 서류 (데이터) 를 한 장의 요약본 (가상 토큰) 으로 압축하되, 중요한 내용은 하나도 잃지 않고 AI 가 읽기 편한 형태로 바꾸는 것입니다.
  • 이 덕분에 AI 는 엄청난 양의 데이터를 빠르게 처리하면서도, 중요한 패턴을 놓치지 않습니다.

3. 이 AI 가 할 수 있는 놀라운 일들

TGPT 는 단순히 데이터를 저장하는 것을 넘어, 다음과 같은 일을 해냅니다.

🕵️‍♂️ 1. 사기 거래 탐지 (Anomaly Detection)

  • 상황: 평소에는 주말에만 커피를 사던 사람이, 평일 새벽 3 시에 갑자기 고가의 명품을 결제했습니다.
  • TGPT 의 역할: "이건 평소 패턴과 너무 다르다!"라고 바로 감지합니다.
  • 결과: 기존 시스템보다 22% 더 정확하게 사기 거래를 찾아냅니다. (비자의 실제 운영 모델보다 훨씬 뛰어납니다.)

🔮 2. 미래 예측 (Generation)

  • 상황: "다음에 이 사람은 어디에 갈까?"
  • TGPT 의 역할: 과거의 이동 경로 (집 → 회사 → 헬스장 → 식당) 를 분석해, "아, 헬스장에 갔으면 이제 식당에 갈 확률이 높다"라고 예측합니다.
  • 결과: 식당이나 상점을 예측하는 정확도가 매우 높습니다.

🗣️ 3. LLM 보다 빠르고 똑똑한 결제 AI

  • 비유: 거대한 언어 모델 (LLM) 이 "전체 도서관의 책을 다 읽어서 답을 찾는다"면, TGPT 는 "결제 데이터 전문 도서관의 책만 빠르게 훑어서 정답을 찾습니다."
  • 결과: LLM 보다 300 배 더 빠르고, 파라미터 (머리 크기) 는 92% 더 작으면서도 결제 관련 예측에서는 더 높은 정확도를 보입니다.

4. 왜 이 연구가 중요한가요?

이 연구는 **"결제 데이터라는 특수한 언어를 위한 AI"**를 만들었다는 점에서 의미가 큽니다.

  • 개인정보 보호: 모든 데이터는 익명화되어 처리되며, 개인의 신원은 보호됩니다.
  • 실용성: 이론적인 모델이 아니라, 실제 비자의 결제 네트워크에서 작동하며 사기를 막고 소비 경험을 개선하는 데 쓰입니다.
  • 미래 지향: 앞으로 우리가 남기는 모든 디지털 흔적 (웹, 앱, IoT 등) 을 이해하는 '기초 모델 (Foundation Model)'의 새로운 기준을 제시합니다.

📝 한 줄 요약

TransactionGPT 는 방대한 결제 기록을 '시간', '영수증 내용', '복잡한 분석 데이터'라는 3 가지 렌즈로 동시에 들여다보고, 당신의 소비 습관을 완벽하게 이해하여 사기를 막고 더 나은 서비스를 제안하는 초지능 AI 입니다.