A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

이 논문은 민주적 참여 과정에 대한 접근성을 지원하기 위해 스페인어, 카탈로니아어, 이탈리아어로 구성된 원문과 인간 전문가가 작성한 쉬운 읽기 (E2R) 텍스트를 포함한 다국어 어휘 코퍼스를 소개하며, 특히 카탈로니아어 최초의 주석 코퍼스를 제공한다는 점을 강조합니다.

Stefan Bott, Verena Riegler, Horacio Saggion, Almudena Rascón Alcaina, Nouran Khallaf

게시일 2026-03-06
📖 3 분 읽기☕ 가벼운 읽기

Each language version is independently generated for its own context, not a direct translation.

이 논문은 **"민주주의의 문을 여는 열쇠: 누구나 읽을 수 있는 쉬운 언어 데이터"**에 대한 이야기입니다.

마치 고급 레스토랑의 복잡한 메뉴판을 상상해 보세요. 전문 용어와 긴 문장으로 가득 차 있어, 일반인이나 장애가 있는 분들은 무엇을 주문해야 할지, 혹은 어떤 재료가 들어갔는지 전혀 이해하지 못합니다. 이 논문은 바로 그 메뉴판을 아이도, 할머니도, 외국에서 온 친구도 모두 한눈에 이해할 수 있는 그림 메뉴판으로 바꾸는 작업을 기록한 것입니다.

이 작업을 세 가지 핵심 비유로 설명해 드릴게요.

1. 문제: "민주주의는 왜 문이 닫혀 있을까?"

민주주의 사회에서 우리는 투표하고, 정책을 논의하고, 내 권리를 주장합니다. 하지만 이 과정에 쓰이는 글들은 너무 어렵고 복잡합니다.

  • 비유: 민주주의 회의실은 마치 자물쇠가 달린 금고와 같습니다. 하지만 그 자물쇠는 '어려운 언어'라는 열쇠로만 열립니다. 지적 장애가 있거나, 글을 읽는 데 어려움을 겪는 사람, 혹은 외국에서 온 이민자들은 이 열쇠를 가지고 있지 않아 금고 안의 보물 (정보와 권리) 에 접근할 수 없습니다.
  • 결과: 그들은 민주주의 과정에 참여하지 못하고, 마치 투명 인간처럼 사라지게 됩니다.

2. 해결책: "전문 요리사들이 만든 '쉬운 요리' 레시피"

이 연구팀은 인공지능 (AI) 이 자동으로 글을 쉽게 바꿔주기를 기다리기보다, **진짜 전문가 (인간 번역가)**들이 직접 글을 다듬는 작업을 했습니다.

  • 비유: 복잡한 원문 (고급 요리) 을 가져와, **전문 요리사 (Easy-to-Read 전문가)**들이 재료를 다듬고, 양념을 줄이고, 맛을 부드럽게 만들어 누구나 먹을 수 있는 '유아용 이유식'이나 '간편식'으로 재탄생시켰습니다.
  • 특징:
    • 스페인어, 카탈로니아어, 이탈리아어 세 가지 언어로 만들었습니다. 특히 카탈로니아어는 이 분야에서 처음 만들어진 '보물' 같은 자료입니다.
    • 단순히 문장을 짧게 줄이는 게 아니라, **어떤 규칙을 적용했는지 (예: 어려운 단어를 쉬운 단어로 바꿈, 문장을 끊음)**를 하나하나 메모 (주석) 로 남겼습니다. 마치 요리사가 "이건 소금 1g, 후추 0.5g 넣었어요"라고 레시피를 적어둔 것과 같습니다.

3. 성과: "누구나 공유할 수 있는 오픈 키친"

이 연구팀이 만든 자료는 이제 **전 세계 누구나 무료로 사용할 수 있는 '오픈 키친'**이 됩니다.

  • 비유: 과거에는 이런 쉬운 요리 레시피는 몇몇 부유한 식당 (특정 기관) 만 비밀로 가지고 있었습니다. 하지만 이제는 이 레시피를 공개해서, AI 개발자들이 이를 학습하게 하거나, 정부 기관이 이 레시피를 따라 민주주의 문서를 쉽게 만들 수 있게 되었습니다.
  • 영향:
    • AI 의 학습: 앞으로는 컴퓨터가 이 레시피를 배워서, 복잡한 법률 문서나 뉴스도 자동으로 쉽게 바꿔줄 수 있게 됩니다.
    • 사회적 변화: 더 많은 사람들이 민주주의 회의실에 들어와 "내 의견이 궁금해요"라고 말할 수 있게 됩니다.

요약하자면

이 논문은 **"복잡한 민주주의의 언어 장벽을 허물기 위해, 전문가들이 세 가지 언어로 '쉬운 읽기' 데이터를 만들고, 그 과정을 공개하여 누구나 참여할 수 있는 세상을 만들자"**는 선언입니다.

이는 단순히 글을 쉽게 쓰는 기술을 넘어, 모든 사람이 민주주의의 주인공이 될 수 있도록 돕는 '언어적 배려'의 실천이라고 할 수 있습니다.