Habermolt: Delegating Deliberation to AI Representatives

본 논문은 에이전트가 집단 의사결정에서 인간을 대표하는 AI 위임 심의용 공개 플랫폼인 하버몰트를 소개하고, 확장 가능하고 신뢰할 수 있는 AI 대표의 새로운 설계 및 정렬 과제를 해결하기 위해 대표성, 집계, 수정의 차원을 통해 그 효과성을 평가한다.

원저자: Joseph Low, Oscar Duys, Claude Formanek, Michiel Bakker, Lewis Hammond

게시일 2026-05-26✓ Author reviewed
📖 3 분 읽기☕ 가벼운 읽기

원저자: Joseph Low, Oscar Duys, Claude Formanek, Michiel Bakker, Lewis Hammond

원본 논문은 CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/) 라이선스로 제공됩니다. 이것은 아래 논문에 대한 AI 생성 설명입니다. 저자가 작성한 것이 아닙니다. 기술적 정확성을 위해서는 원본 논문을 참조하세요. 전체 면책 조항 읽기

새로운 커뮤니티 규칙에 대해 투표하고 싶다고 상상해 보세요. 예를 들어, "더 많은 나무를 심을까, 아니면 새로운 공원을 만들까?" 같은 질문입니다. 이상적인 세상에서는 모두가 함께 앉아 이야기를 나누고 합의에 도달할 것입니다. 하지만 현실에서는 바쁘거나 피곤하거나, 아예 참석할 수 없는 경우가 많습니다. 그래서 보통은 당신을 대신해 갈 인간 대표 (예: 시의회 의원) 를 선택합니다. 하지만 그 사람이 정확히 당신이 무엇을 생각하는지 알지 못할 수도 있고, 당신에게 알리지 않은 채 생각을 바꿀 수도 있습니다.

이 논문은 **AI 위임 심의 (AI-delegated deliberation)**라는 새로운 아이디어를 소개합니다. 인간 대표 대신 당신의 의견을 **AI 에이전트 (디지털 로봇)**에게 맡기는 것입니다. 이 로봇은 당신이 무엇을 생각하는지 학습하고, 당신이 참석할 수 없을 때 '회의'에 참석하여 당신의 주장을 펼치고, 최종 결정을 내리는 데 도움을 줍니다.

연구진은 이것이 실제로 작동하는지 확인하기 위해 HABERMOLT라는 실증적 놀이터를 구축했습니다. 그들은 다음 세 가지 주요 원칙을 통해 이를 테스트했습니다:

1. 대표성: "디지털 트윈" 인터뷰

개념: AI 는 당신의 생각을 어떻게 알까요?
유추: AI 를 당신을 위해 일기를 쓰는 개인 비서라고 생각하세요.

  • 작동 방식: 당신은 AI 에이전트와 대화합니다. AI 는 질문을 하고 (예: "사과와 오렌지 중 무엇을 선호하나요?"), 당신의 답변을 '기억 파일'에 저장합니다.
  • 발견된 문제: AI 가 당신과 대화하지 않은 상태에서 혼자 회의에 참석할 때, 그 목소리는 다소 일반화되는 경향이 있습니다. 마치 교과서는 공부했지만 당신이 들려준 구체적인 이야기들은 잊어버린 학생과 같습니다. AI 의 의견들은 서로 매우 비슷해지기 시작하여, 실제 당신의 개성에서 비롯된 고유한 '맛'을 잃어버렸습니다.
  • 해결책: 회의 직전에 특정 주제에 대해 AI 와 구체적으로 대화하면, AI 는 훨씬 더 당신처럼 들립니다.

2. 집계: "그룹 투표"

개념: 이 모든 서로 다른 AI 에이전트들의 생각을 어떻게 하나의 최종 결정으로 합칠까요?
유추: 모두가 요리를 가져와 메뉴를 투표하는 포틀럭 디너를 상상해 보세요.

  • 작동 방식: HABERMOLT 에서 각 AI 에이전트는 두 가지 일을 합니다:
    1. 무언가 빠졌다고 생각하면 새로운 요리 (진술) 를 제안합니다.
    2. 모든 요리를 '가장 맛있는 것'부터 '역겨운 것'까지 순위 매깁니다.
      그런 다음 시스템은 슈울체 순위 (Schulze ranking) 라는 특수한 수학 공식을 사용하여 모두가 합의할 수 있는 요리를 찾습니다.
  • 발견된 문제: 트레이드오프가 존재합니다.
    • 모두에게 안전하고 진실한 결정을 원한다면, 결과는 종종 모호합니다 (예: "우리는 좋은 일을 해야 합니다").
    • 구체적이고 실행 가능한 결정을 원한다면 (예: "다음 화요일까지 5 번가에 공원을 건설한다"), 그것이 모두의 진정한 감정을 대표하지 않는 것처럼 느껴질 수 있습니다.
    • 연구진은 AI 에이전트들이 스스로 제안을 작성하고 그것에 투표하게 하는 방법 (그들이 사용한 방법) 이 가장 구체적이지는 않더라도 사용자들에게 '현실감'을 느끼게 하는 가장 좋은 방법임을 발견했습니다.

3. 수정: "실행 취소 버튼"

개념: AI 가 잘못하거나 당신이 생각을 바꾸면 어떻게 될까요?
유추: 언제나든 에이전트의 실수를 수정할 수 있는 실시간 편집 문서라고 생각하세요.

  • 작동 방식: AI 에이전트가 당신이 동의하지 않는 말을 하면, 로그인하여 '기억'을 편집하거나 투표를 변경할 수 있습니다. 시스템은 당신의 새로운 입력을 기반으로 그룹 결정을 즉시 다시 계산합니다.
  • 발견된 문제: 아무도 실행 취소 버튼을 사용하지 않았습니다. 시스템이 실수를 수정할 수 있도록 설계되었음에도 불구하고, 90% 이상의 사용자는 에이전트의 작업을 한 번도 확인하지 않았습니다.
  • 위험: AI 가 실수를 하면 그 실수가 그대로 남습니다. 시스템은 사람들이 확인하도록 매주 이메일을 보내지만, 대부분의 사람들은 이를 무시합니다. 연구진은 이것이 작동하려면 '수정' 과정이 훨씬 더 쉽고 명확해야 함을 깨달았습니다.

핵심 결론

이 논문은 AI 위임 심의가 수백만 명이 몇 시간의 자유 시간 없이도 민주주의에 참여할 수 있게 해주는 강력한 아이디어라고 결론 내립니다. 그러나 이는 아직 완전히 테스트되지 않은 새로운 차와 같습니다.

  • 좋은 점: 참여를 확장합니다. 목소리를 내기 위해 그곳에 있을 필요가 없습니다.
  • 나쁜 점: AI 는 때때로 당신보다는 너무 일반적인 로봇처럼 들리며, 사람들은 그것이 진실을 말하고 있는지 확인하지 않습니다.

연구진은 이러한 AI 들을 위해 당신이 정확히 누구인지 기억하는 더 나은 '기억 시스템'을 구축해야 한다고 말합니다. 또한, 일이 잘못되었을 때 인간이 개입하여 디지털 대표를 수정할 수 있도록 훨씬 더 쉽게 만들어야 합니다. 그전까지는 이 로봇들이 우리를 대신해 말하도록 신뢰하는 데 신중해야 합니다.

연구 분야의 논문에 파묻히고 계신가요?

연구 키워드에 맞는 최신 논문의 일일 다이제스트를 받아보세요 — 기술 요약 포함, 당신의 언어로.

Digest 사용해 보기 →