Tracker Installations Are Not Created Equal: Understanding Tracker Configuration of Form Data Collection

이 논문은 구글과 메타의 추적기가 웹사이트 관리자에게 개인정보 수집을 권장하고 기본 설정에 포함시키는 방식을 분석하고, 4 만 개 이상의 웹사이트를 측정한 결과 메타 추적기가 구글보다 훨씬 높은 비율로 양식 데이터 수집이 활성화되어 있으며, 특히 금융 및 의료 사이트에서 정책 위반 가능성이 있음을 규명했습니다.

Julia B. Kieserman, Athanasios Andreou, Chris Geeng, Tobias Lauinger, Damon McCoy

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"웹사이트에 설치된 추적기 (Tracker) 들이 모두 똑같은 역할을 하는 것은 아니다"**라는 놀라운 사실을 밝혀냈습니다.

쉽게 말해, **"우리가 웹사이트에 정보를 입력할 때, 그 정보가 광고 회사 (구글, 메타) 로 바로 넘어가는 설정이 의도치 않게 켜져 있는 경우가 매우 많다"**는 것입니다. 특히 건강이나 금융 같은 민감한 정보를 다루는 사이트에서도 이런 일이 벌어지고 있습니다.

이 복잡한 연구를 일상적인 비유로 쉽게 설명해 드릴게요.


1. 핵심 비유: "스마트한 도우미" vs "지나친 호기심"

웹사이트를 운영하는 주인 (관리자) 은 광고를 더 잘 띄우기 위해 구글이나 **메타 (페이스북)**의 '스마트 도우미 (추적기)'를 부릅니다. 이 도우미는 방문자가 무엇을 보고, 무엇을 샀는지 알려주어 더 좋은 광고를 보여줍니다.

하지만 문제는 이 도우미들이 방문자의 이름, 전화번호, 이메일 같은 '개인 비밀'까지 자동으로 훔쳐보게 설정되어 있다는 점입니다.

  • 구글 (Google Tag): 도우미가 들어오면 "안녕하세요, 저는 여기저기 다닐 수 있어요"라고 인사만 하고, 개인 정보는 건드리지 않겠다고 약속하는 것처럼 행동합니다. 하지만 설정을 직접 찾아서 켜야만 정보를 수집합니다. (설정이 복잡해서 대부분 끄거나 모르고 넘어갑니다.)
  • 메타 (Meta Pixel): 도우미가 들어오자마자 **"저는 모든 정보를 다 챙겨드릴게요! 이름, 전화번호, 이메일 다 가져가도 될까요?"**라고 물어보며, 기본적으로 '네'라고 체크된 상태로 시작합니다. 주인이 "아니요"라고 직접 끄지 않는 한, 모든 정보를 가져갑니다.

2. 연구의 주요 발견 (3 가지 이야기)

① "설명서"가 우리를 속입니다 (다크 패턴)

구글과 메타는 웹사이트 주인들에게 설명서를 줍니다. 그런데 이 설명서가 **사실은 "광고 마케팅 자료"**와 비슷합니다.

  • 비유: 마치 "이 약을 드시면 건강해집니다!"라고 말하면서, "부작용은 hashing(해시) 라는 마법으로 사라집니다"라고 속이는 것과 같습니다.
  • 현실: "해시 (Hashing)"라는 기술은 데이터를 암호화해서 보호해준다고 하지만, 연구진과 미국 정부 (FTC) 는 **"해시만으로는 개인을 식별할 수 없게 만들 수 없다"**고 이미 여러 번 지적했습니다. 그런데도 설명서에는 "이렇게 하면 안전해요"라고 적혀 있어, 웹사이트 주인들은 모르고 위험한 설정을 켜게 됩니다.

② "자동 설정"의 함정

  • 메타의 함정: 메타는 설정을 할 때, "고객 정보를 자동으로 수집할까요?"라는 창을 띄우고 기본값을 'ON'으로 설정해 둡니다. 웹사이트 주인은 그냥 '다음'을 누르기만 해도, 방문자의 이름과 전화번호가 메타로 전송되도록 설정이 완료됩니다.
  • 구글의 방식: 구글은 이 설정이 기본으로 꺼져 있습니다. 하지만 설정이 너무 복잡하고 설명이 명확하지 않아, 주인이 실수로 켜버리거나 모르고 넘어가는 경우가 많습니다.

③ "병원"과 "은행"에서도 벌어지는 일

이 연구는 가장 민감한 곳인 **병원 (건강)**과 은행 (금융) 웹사이트를 조사했습니다.

  • 규칙: 구글과 메타는 "병원이나 은행은 개인 정보를 수집하면 안 돼요"라고 규칙을 정해두었습니다.
  • 현실: 하지만 메타 추적기가 설치된 병원/은행 사이트의 30~60% 가 실제로는 환자나 고객의 정보를 수집하도록 설정되어 있었습니다.
  • 이유: 웹사이트 주인이 "우리는 일반 쇼핑몰이에요"라고 잘못 신고하거나, 설정을 제대로 확인하지 않아 규칙을 우회한 것입니다. 실제로 '자살 예방 핫라인', '마약 재활 센터', '대출 회사' 같은 곳에서도 방문자의 정보가 유출되고 있었습니다.

3. 결론: 우리가 무엇을 배웠나요?

이 논문은 **"기술이 나쁜 게 아니라, 그 기술을 어떻게 설정하느냐가 중요하다"**는 점을 강조합니다.

  • 웹사이트 주인에게: "설치만 하면 끝이 아니다. 설정을 꼼꼼히 확인하지 않으면, 방문자의 비밀이 광고 회사로 넘어갈 수 있다"는 경고를 보냅니다.
  • 구글과 메타에게: "설치 설명서를 더 명확하게, 그리고 위험을 솔직하게 알려야 한다"고 요구합니다. 특히 '해시'가 만능 해결책이 아니라는 점을 인정해야 합니다.
  • 일반 사용자에게: 우리가 웹사이트에 이메일이나 전화번호를 입력할 때, 그 정보가 어디로 가는지는 우리가 통제하기 어렵다는 사실을 알게 됩니다.

요약

이 연구는 **"구글과 메타가 웹사이트에 설치된 추적기를 통해, 우리가 입력한 민감한 정보 (이름, 전화번호 등) 를 자동으로 수집하도록 유도하고 있으며, 특히 건강/금융 사이트에서도 이 설정이 잘못되어 유출되고 있다"**는 사실을 폭로했습니다. 마치 우리가 약국에 가서 약을 사는데, 약사가 몰래 약의 성분을 광고 회사에 보고하는 설정이 기본으로 켜져 있었던 것과 같은 상황입니다.

이제 우리는 이 설정이 얼마나 흔한지, 그리고 어떻게 고쳐야 하는지 알게 되었습니다.