Leveraging Wikidata for Geographically Informed Sociocultural Bias Dataset Creation: Application to Latin America

이 논문은 위키데이터와 전문가 지식을 활용하여 라틴아메리카의 다양한 사회문화적 편향을 평가할 수 있는 26,000 개 이상의 다국어 질문 - 답변 데이터셋 (LatamQA) 을 구축하고, 이를 통해 대규모 언어 모델이 라틴아메리카 문화보다 이베리아 스페인 문화에 더 치우친 편향을 보이며 언어와 지역에 따라 성능 편차가 있음을 규명했습니다.

Yannis Karmim (ALMAnaCH), Renato Pino (UCHILE), Hernan Contreras (UCHILE), Hernan Lira (CENIA), Sebastian Cifuentes (CENIA), Simon Escoffier (PUC), Luis Martí (UP4, ALPAGE), Djamé Seddah (UP4, ALPAGE), Valentin Barrière (UCHILE, CENIA)

게시일 2026-03-12
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"인공지능 (AI) 이 라틴아메리카의 문화를 얼마나 잘 알고 있을까?"**라는 질문에 답하기 위해 진행된 흥미로운 연구입니다.

쉽게 비유하자면, 이 연구는 **"전 세계적으로 유명한 AI 선생님들이, 라틴아메리카라는 거대한 '지역 도서관'의 책들을 얼마나 잘 읽었는지 시험을 치른 결과"**라고 볼 수 있습니다.

주요 내용을 일상적인 언어와 비유로 설명해 드릴게요.


1. 문제 상황: "북극곰이 사막의 모래를 모를 수밖에 없죠"

현재 유명한 AI 모델들 (LLM) 은 주로 미국이나 유럽 (북반구) 의 데이터로 배웠습니다. 그래서 미국이나 유럽의 문화는 잘 알지만, 라틴아메리카 (남미) 의 문화는 잘 모르는 경우가 많습니다.

  • 비유: 마치 미국에서 태어난 요리사가 이탈리아 파스타는 잘 만들지만, 멕시코의 타코나 브라질의 페이조아다 같은 현지 음식은 잘 모를 수 있는 것과 같습니다.
  • 현실: 라틴아메리카는 스페인어와 포르투갈어를 쓰지만, 나라마다 역사와 문화가 다릅니다. 그런데 기존 AI 시험 문제들은 이 세세한 차이를 무시하고 "라틴아메리카"라고 뭉뚱그려서 내거나, 아예 영어로만 냅니다.

2. 해결책: "위키백과라는 거대한 보물상자"

연구팀은 라틴아메리카의 문화 지식을 AI 가 얼마나 알고 있는지 정확히 측정하기 위해, **26,000 개가 넘는 새로운 시험 문제 (LatamQA)**를 만들었습니다.

  • 어떻게 만들었나요?
    • 보물찾기: 위키백과 (Wikipedia) 에 있는 '문화' 관련 글들을 모았습니다.
    • 현장 전문가의 손길: 사회학자 (문화 전문가) 들이 "이 글은 진짜 문화적인 가치가 있다"고 골라냈습니다. (예: 멕시코의 특정 음식, 칠레의 특정 슬랭, 아르헨티나의 전통 등)
    • AI 가 문제를 내다: 골라낸 글들을 바탕으로 AI 가 스스로 질문과 답을 만들게 했습니다. (예: "페루의 '마조모라 모라다'라는 디저트의 뿌리는 어디인가?")
    • 결과: 스페인어, 포르투갈어, 영어로 된 26,000 개의 객관식 문제가 완성되었습니다.

3. 시험 결과: AI 들의 성적표

이 새로운 시험지로 다양한 AI 모델들을 시험해 보니 놀라운 결과들이 나왔습니다.

① "내 언어로 말하면 더 잘해요"

  • 결과: AI 는 자기가 배운 언어 (스페인어, 포르투갈어) 로 질문을 받을 때 훨씬 잘 맞췄습니다.
  • 비유: 한국어 시험을 볼 때 영어로 번역된 문제를 풀면 실수하지만, 한국어로 된 문제를 보면 훨씬 잘 푸는 것과 같습니다.

② "스페인 (유럽) 은 잘 알지만, 남미는 모릅니다"

  • 결과: AI 들은 유럽의 스페인 (이베리아 반도) 문화는 잘 알았지만, 남미의 스페인어권 국가 (멕시코, 칠레 등) 문화는 상대적으로 못 알아맞혔습니다.
  • 비유: **파리 (유럽)**의 맛집 정보는 다 알고 있지만, **파리에서 8,000km 떨어진 부에노스아이레스 (남미)**의 맛집 정보는 잘 모르는 것과 같습니다. AI 가 배운 데이터가 유럽 중심이라서 생긴 일입니다.

③ "모델이 클수록 점수가 올라갑니다"

  • 결과: AI 의 두뇌 (모델 크기) 가 클수록 문화를 더 잘 이해했습니다.
  • 비유: 작은 도서관보다 거대한 도서관을 가진 AI 가 더 많은 문화적 지식을 가지고 있다는 뜻입니다.

④ "지역별 편차가 큽니다"

  • 결과: 어떤 나라는 AI 가 쉽게 맞췄고, 어떤 나라는 매우 어려워했습니다.
  • 비유: AI 는 멕시코브라질 같은 큰 나라의 문화는 잘 알지만, 코스타리카온두라스 같은 작은 나라의 문화는 잘 모릅니다. 데이터가 많은 나라를 더 잘 아는 것입니다.

4. 결론 및 시사점

이 연구는 **"AI 가 라틴아메리카의 문화를 제대로 이해하려면, 현지 언어와 세세한 문화적 맥락을 고려한 데이터가 필요하다"**는 것을 증명했습니다.

  • 핵심 메시지: AI 를 더 똑똑하고 공평하게 만들려면, 단순히 영어 데이터만 쌓는 것이 아니라 라틴아메리카 현지인의 눈과 언어로 세상을 바라보는 데이터를 채워줘야 합니다.

한 줄 요약

"지금의 AI 는 유럽 중심의 '글로벌 스타'지만, 라틴아메리카의 '지역 전문가'가 되려면 현지 언어와 문화로 채워진 새로운 시험지 (LatamQA) 가 필요하다는 연구입니다."