A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Dieses Paper stellt ein mehrsprachiges, von Menschen annotiertes Korpus mit Originaltexten und vereinfachten Easy-to-Read-Versionen für Spanisch, Katalanisch und Italienisch vor, um die automatische Textvereinfachung zu unterstützen und den Zugang zu demokratischen Partizipationsprozessen zu fördern.

Stefan Bott, Verena Riegler, Horacio Saggion, Almudena Rascón Alcaina, Nouran Khallaf

Veröffentlicht 2026-03-06
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Each language version is independently generated for its own context, not a direct translation.

Hier ist eine einfache Erklärung der wissenschaftlichen Arbeit, als würde man sie einem Freund beim Kaffee erzählen – mit ein paar bildhaften Vergleichen.

🌍 Das große Problem: Die "Sprachmauer"

Stell dir vor, Demokratie ist ein riesiges, wichtiges Fest, an dem alle mitreden und mitentscheiden sollen. Aber das Problem ist: Die Einladungen und die Regeln sind in einer Sprache verfasst, die viele Menschen nicht verstehen.

Es gibt Menschen mit Lernschwierigkeiten, Menschen, die gerade erst in ein neues Land gezogen sind, oder einfach Leute, die von komplexen Verwaltungssprachen überfordert sind. Für sie ist das Fest verschlossen. Sie sind wie Gäste, die vor der Tür stehen, weil die Türschlösser (die Texte) zu kompliziert sind.

Bisher gab es nur wenige Helfer, die diese Texte in eine einfache Sprache übersetzt haben. Und wenn man versucht, Computer (Künstliche Intelligenz) zu trainieren, damit sie das automatisch machen, fehlt ihnen das nötige "Lernmaterial". Es gibt einfach zu wenig hochwertige Beispiele, wie ein schwerer Text in einen leichten Text verwandelt wird – besonders in Sprachen wie Spanisch, Katalanisch und Italienisch.

🛠️ Die Lösung: Ein neues "Lernbuch" für Computer und Menschen

Die Autoren dieser Arbeit (ein Team aus verschiedenen Universitäten und Organisationen) haben sich gedacht: "Wir müssen das ändern!" Sie haben ein riesiges, mehrsprachiges Lernbuch (einen sogenannten "Korpus") erstellt.

Stell dir dieses Buch wie einen Kochkurs vor:

  • Die Original-Rezepte: Das sind die schweren, komplizierten Texte über Politik, Gesetze und Bürgerrechte (z. B. "Wie funktioniert die EU-Wahl?" oder "Was sind meine Rechte als Kind?").
  • Die einfachen Gerichte: Das sind die vereinfachten Versionen, die von echten Experten geschrieben wurden. Diese Experten sind wie Meisterköche für einfache Sprache. Sie wissen genau, welche Zutaten (Wörter) man weglassen muss und wie man das Gericht so schmeckt, dass es jeder versteht.
  • Die Kochanleitung: Das ist das Besondere an diesem Buch. Die Experten haben nicht nur gekocht, sondern auch notiert, warum sie was geändert haben. "Ich habe das Wort 'Legislative' durch 'Gesetze' ersetzt, weil es einfacher ist." Oder "Ich habe den langen Satz in drei kurze Sätze aufgeteilt."

🗣️ Was ist neu daran?

Bisher gab es so ein "Kochbuch" für die Sprache Katalanisch (gesprochen in Teilen Spaniens) überhaupt noch nicht. Für Spanisch und Italienisch gab es nur sehr wenige Beispiele.

Das Team hat also:

  1. Drei neue Sprachen abgedeckt (Spanisch, Katalanisch, Italienisch).
  2. Echte Experten eingesetzt (keine Laien oder gestresste Crowdworker, die nur schnell etwas abhaken).
  3. Themen gewählt, die für die Demokratie wichtig sind (Politik, Gesetze, Bürgerrechte).
  4. Alles kostenlos für alle gemacht, damit jeder (Forscher, Entwickler, Lehrer) daraus lernen kann.

🧩 Wie funktioniert das "Lernen" für die KI?

Früher haben Computer versucht, Texte zu vereinfachen, indem sie raten mussten. Das ist wie ein Schüler, der eine Matheaufgabe löst, ohne die Formel zu kennen – er rät einfach.

Mit diesem neuen "Lernbuch" können Computer jetzt üben. Sie sehen das Original und die perfekte, vereinfachte Version dazu. Sie sehen auch die Notizen der Experten. So lernen sie die Regeln der einfachen Sprache:

  • Vermeide Fachwörter.
  • Benutze kurze Sätze.
  • Erkläre schwierige Begriffe.

🚀 Warum ist das so wichtig?

Wenn Computer diese Kunst beherrschen, können sie in Zukunft automatisch Tausende von politischen Texten, Gesetzestexten oder Nachrichten in eine Sprache übersetzen, die jeder versteht.

Das ist wie ein Schlüssel, der die Tür zur Demokratie für alle öffnet. Wenn jeder die Regeln versteht, kann jeder mitreden. Niemand muss mehr draußen vor der Tür stehen, nur weil die Sprache zu schwer war.

Zusammengefasst:
Die Autoren haben ein wertvolles Werkzeug gebaut, damit Computer lernen können, komplexe politische Texte in einfache, verständliche Sprache zu verwandeln. Damit wird die Demokratie für alle Menschen – egal ob sie Schwierigkeiten beim Lesen haben oder eine andere Muttersprache sprechen – endlich wirklich für alle zugänglich.