A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Este artigo apresenta um corpus multilingue de textos originais e suas versões simplificadas para "Leitura Fácil", anotados por especialistas humanos em espanhol, catalão e italiano, criado para apoiar o acesso a processos democráticos participativos e preencher a lacuna de recursos de alta qualidade para essas línguas.

Stefan Bott, Verena Riegler, Horacio Saggion, Almudena Rascón Alcaina, Nouran Khallaf

Publicado 2026-03-06
📖 4 min de leitura☕ Leitura rápida

Each language version is independently generated for its own context, not a direct translation.

Imagine que a democracia é uma grande festa comunitária onde todos devem poder opinar, votar e entender as regras do jogo. O problema é que, muitas vezes, os convites e as regras são escritos em uma "língua de especialista": cheia de palavras difíceis, frases longas e complicadas, como se fosse um código secreto que só os iniciados conseguem decifrar.

Muitas pessoas, como aquelas com dificuldades de leitura, idosos ou quem está aprendendo o idioma, acabam ficando de fora dessa festa, não porque não querem participar, mas porque não conseguem entender o convite.

Este artigo apresenta uma solução brilhante para esse problema: um novo "tradutor" feito à mão para três línguas (Espanhol, Catalão e Italiano) que transforma textos difíceis em textos fáceis de ler.

Aqui está a explicação do projeto, usando algumas analogias simples:

1. O Problema: A "Parede de Vidro"

Pense nos textos oficiais do governo e das notícias como uma parede de vidro. Você consegue ver o que está acontecendo do outro lado, mas não consegue tocar, sentir ou entender completamente a mensagem se ela estiver escrita em uma linguagem muito complexa. Para pessoas com deficiência intelectual ou baixa escolaridade, essa parede é tão alta que eles nem conseguem ver o que há atrás dela. Eles ficam invisíveis para o processo democrático.

2. A Solução: O "Maestro da Simplificação"

Os autores criaram um banco de dados (um corpus) que funciona como uma "caixa de ferramentas" para quebrar essa parede. Eles pegaram textos originais complexos (sobre leis, direitos, saúde e política) e os reescreveram, transformando-os em "Linguagem Fácil" (conhecida como Easy-to-Read ou E2R).

  • A Analogia da Cozinha: Imagine que o texto original é um prato gourmet muito sofisticado, com ingredientes exóticos e temperos que o público geral não conhece. Os especialistas deste projeto pegaram esse prato e o transformaram em uma receita caseira deliciosa e nutritiva, usando ingredientes que todo mundo conhece e gosta, mantendo o mesmo valor nutricional (a informação), mas tornando-a acessível a todos.

3. O Trabalho de Detetive (A Anotação)

O que torna este projeto especial não é apenas a tradução, mas o diário de bordo que os tradutores deixaram.

  • Eles não apenas reescreveram o texto; eles explicaram como e por que mudaram cada palavra.
  • Analogia: É como se um chef não apenas servisse o prato, mas deixasse um bilhete dizendo: "Troquei o açafrão caro por cúrcuma porque é mais fácil de encontrar", ou "Cortei a cebola em pedaços menores para não machucar quem está comendo".
  • Isso é crucial para os computadores (Inteligência Artificial). Hoje em dia, queremos que robôs aprendam a fazer essa simplificação sozinhos. Mas, para ensinar um robô, você precisa mostrar exemplos perfeitos e explicar as regras. Este banco de dados é o livro de receitas perfeito para ensinar essas máquinas a serem "tradutores humanos".

4. Por que Catalão, Espanhol e Italiano?

Até agora, existiam muitos desses "livros de receitas" para o inglês, mas faltavam para as línguas do sul da Europa.

  • O Catalão era como uma ilha sem mapa: não existiam dados desse tipo antes. Agora, pela primeira vez, temos um mapa completo.
  • Para o Espanhol e Italiano, os dados eram como um pequeno jardim; agora, transformaram-se em uma floresta rica e detalhada.

5. O Objetivo Final: Uma Democracia Inclusiva

O projeto nasceu da ideia de que entender é poder.
Se você não entende a lei que foi aprovada, você não pode participar da discussão sobre ela. Ao tornar esses textos acessíveis, o projeto abre as portas da democracia para milhões de pessoas que antes estavam trancadas do lado de fora.

Resumo em uma frase:
Os autores criaram um tesouro de textos "traduzidos" para uma linguagem simples e clara, anotando cada passo do processo, para que tanto humanos quanto computadores possam ajudar a garantir que ninguém fique de fora da conversa democrática por não conseguir ler o convite.

E o melhor de tudo? Esse tesouro será gratuito e aberto a todos, como um presente para a sociedade.