M2^2: Dual-Memory Augmentation for Long-Horizon Web Agents via Trajectory Summarization and Insight Retrieval

이 논문은 긴 시간의 웹 작업에서 발생하는 한계를 해결하기 위해 동적 궤적 요약과 인사이트 검색을 결합한 훈련 불필요의 이중 기억 증강 프레임워크인 M2^2를 제안하며, 이를 통해 다양한 벤치마크에서 성공률 향상과 토큰 사용량 감소를 동시에 달성함을 보여줍니다.

Dawei Yan, Haokui Zhang, Guangda Huzhang, Yang Li, Yibo Wang, Qing-Guo Chen, Zhao Xu, Weihua Luo, Ying Li, Wei Dong, Chunhua Shen

게시일 2026-03-03
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

🌐 문제: AI 가 길을 잃는 이유

지금까지의 AI 에이전트들은 웹사이트를 돌아다닐 때, 방금 전부터 지금까지 본 모든 화면 (스크린샷) 과 클릭 기록을 다 기억하려고 했습니다.

  • 비유: 마치 여행 중일 때, 출발지부터 현재까지 본 모든 풍경의 사진을 100 장이나 1,000 장이나 주머니에 넣고 다니는 사람을 상상해 보세요.
  • 문제점:
    1. 가방이 너무 무거워짐 (비용 증가): AI 가 처리해야 할 정보량이 너무 많아져서 속도가 느리고 돈 (컴퓨팅 비용) 이 많이 듭니다.
    2. 중요한 것을 놓침 (혼란): 가방 속에 불필요한 사진이 너무 많아서, 정작 "다음에 어디로 가야 하나?"라는 중요한 단서를 찾지 못합니다. (이걸 논문에서는 'Lost-in-the-middle'이라고 부릅니다.)

✨ 해결책: M2 (이중 기억 시스템)

이 논문은 AI 에게 두 가지 특별한 능력을 부여해서 이 문제를 해결합니다.

1. 내면의 기억 (Internal Memory): "요약하는 여행 일기"

AI 는 매번 모든 화면을 저장하는 대신, 매 단계마다 '핵심만 요약한 일기'를 씁니다.

  • 비유: 여행 중일 때, "아침에 커피 마시고, 버스를 타고, 박물관에 갔다"라고 간단한 문장 한 줄로 기록하는 거예요.
  • 효과:
    • 복잡한 화면 사진 100 장 대신, 간결한 문장 10 줄만 기억합니다.
    • AI 의 머릿속 (메모리) 이 항상 가볍고 깔끔하게 유지되어, "지금 어디까지 왔지?"를 정확히 파악할 수 있습니다.
    • 결과: 불필요한 정보 (광고, 사이드바 등) 를 버리고 핵심 행동만 남깁니다.

2. 외부의 기억 (External Memory): "현명한 선배의 팁"

AI 는 혼자서 모든 것을 배우는 게 아니라, 과거에 성공한 다른 AI 들의 '꿀팁'을 찾아서 참고합니다.

  • 비유: 여행을 가기 전에 그곳을 잘 아는 선배에게 "거기 가면 실수하기 쉬운 게 있어요. A 버튼을 누르면 안 되고, B 버튼을 먼저 눌러야 해요"라는 팁을 받아오는 것입니다.
  • 작동 방식:
    • AI 가 "애플 웹사이트에서 맥북 가격을 찾아줘"라고 요청하면, 시스템은 과거에 성공한 수많은 기록에서 "가격 비교할 때 이런 순서로 클릭하면 실패하지 않아요" 같은 전략적인 조언을 찾아냅니다.
    • AI 는 이 팁을 받아서 "아, 내가 실수하지 않도록 조심해야겠다"라고 미리 대비합니다.
  • 효과: 같은 실수를 반복하지 않고, 복잡한 웹사이트 구조에서도 길을 잘 찾습니다.

🚀 이 기술의 놀라운 성과

이 'M2' 시스템을 적용했을 때, AI 는 다음과 같은 변화를 겪었습니다.

  1. 성공률 대폭 상승: 특히 오픈소스 모델 (Qwen3-VL) 이 상용 모델 (Claude 등) 못지않게 똑똑해졌습니다. (성공률이 최대 19.6% 까지 올랐습니다.)
  2. 비용 절감: 불필요한 정보를 버리고 요약만 하니까, AI 가 처리해야 할 데이터 양이 약 58% 나 줄었습니다. 이는 곧 시간과 돈이 절반 가까이 아껴진다는 뜻입니다.
  3. 훈련 불필요 (Training-Free): AI 를 다시 가르치거나 (학습) 복잡한 코드를 짜지 않아도, 단순히 '요약'과 '팁'을 주는 방식만으로도 성능이 좋아졌습니다.

💡 한 줄 요약

"AI 가 긴 여행을 할 때, 모든 사진을 가방에 넣지 말고 '핵심 요약 일기'를 쓰게 하고, '선배들의 성공 팁'을 참고하게 하면, 길을 잃지 않고 훨씬 빠르고 저렴하게 목적지에 도착할 수 있다!"

이 기술은 앞으로 우리가 AI 를 이용해 복잡한 업무를 처리할 때, 더 빠르고 똑똑하게 도와줄 수 있는 핵심 열쇠가 될 것입니다.