Hijacking Text Heritage: Hiding the Human Signature through Homoglyphic Substitution

Diese Arbeit untersucht, wie die Substitution von Zeichen durch visuell ähnliche Homoglyphe die stilometrische Analyse von Texten stören und so den Schutz der persönlichen Identität vor forensischer Auswertung gewährleisten kann.

Ursprüngliche Autoren: Robert Dilworth

Veröffentlicht 2026-04-14
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Each language version is independently generated for its own context, not a direct translation.

Die unsichtbare Tinte, die deine Identität verschleiert

Stell dir vor, dein Schreibstil ist wie ein digitaler Fingerabdruck. Genau wie deine Hand einen einzigartigen Abdruck hinterlässt, hinterlässt auch deine Art zu schreiben (welche Wörter du nutzt, wie lange deine Sätze sind, welche Fehler du machst) ein Muster. Computer können diesen Muster lesen und sagen: „Aha, das hat bestimmt Person X geschrieben!" Das ist nützlich, um Plagiate zu finden, aber es ist auch gefährlich, wenn jemand deine Privatsphäre ausspionieren will.

Dieser Artikel beschreibt einen neuen Trick, um diesen digitalen Fingerabdruck zu verwischen. Der Autor nennt das „Homoglyphen-Ersatz" (oder auf Deutsch: „Verwechslungs-Trick").

1. Der Trick: Der „Zwilling" im Text

Stell dir vor, du hast einen Brief geschrieben. Jetzt nimmst du einen Stift und tauschst in manchen Wörtern einen Buchstaben gegen einen aus, der genauso aussieht, aber eigentlich ein anderer ist.

  • Das normale „a" (aus dem lateinischen Alphabet) sieht fast genauso aus wie das „а" (aus dem kyrillischen Alphabet).
  • Das normale „e" sieht fast genauso aus wie das „е" (aus dem kyrillischen Alphabet).

Für das menschliche Auge sieht der Satz immer noch perfekt aus: „Hallo Welt". Aber für den Computer sind es zwei völlig verschiedene Buchstaben mit unterschiedlichen Codes. Es ist, als würdest du in eine Gruppe von Zwillingen einen Fremden schleusen, der exakt so aussieht wie die anderen, aber eine ganz andere Identität hat.

2. Warum macht man das? (Das „Vergiften" des Brunnens)

Normalerweise nutzen Hacker solche Tricks, um sich als jemand anderes auszugeben (z. B. um auf eine gefälschte Bankseite zu leiten). Aber in diesem Artikel geht es um das Gegenteil: Schutz.

Der Autor sagt: Wenn große Tech-Firmen oder Überwachungsbehörden deine Texte sammeln, um ein Profil von dir zu erstellen (z. B. um zu wissen, was du denkst, wie alt du bist oder wo du wohnst), dann kannst du diesen Prozess „vergiften".

Stell dir vor, die Überwacher sammeln Wasser aus einem Brunnen, um dein Profil zu analysieren. Der Autor schlägt vor, man wirft eine unsichtbare, aber wirksame Substanz in den Brunnen. Das Wasser sieht immer noch klar aus, aber wenn die Überwacher es trinken (analysieren), bekommen sie falsche Ergebnisse. Sie denken vielleicht, der Text stammt von einem alten Mann aus dem Norden, obwohl er von einer jungen Frau aus dem Süden geschrieben wurde.

3. Wie viel muss man ändern?

Der Autor hat experimentiert, wie viel man ändern muss, damit der Trick funktioniert.

  • Zu wenig ändern (unter 12 %): Der Computer merkt nichts. Dein Fingerabdruck bleibt sichtbar.
  • Genau richtig (ca. 37,5 %): Ab diesem Punkt wird es für den Computer schwierig. Er ist verwirrt. Er kann nicht mehr sicher sagen, wer der Autor ist. Es ist, als würdest du in ein Foto 37 % der Pixel leicht verschieben – das Bild ist noch da, aber das Gesicht ist nicht mehr wiederzuerkennen.
  • Zu viel ändern (über 50 %): Es bringt keinen großen Vorteil mehr, aber es kostet mehr Arbeit.

4. Die „TraceTarnish"-Maschine

Der Autor hat ein kleines Programm namens TraceTarnish entwickelt. Das ist wie ein automatischer Koch, der deine Texte nimmt und sie mit diesen „Zwillingen" (Homoglyphen) und unsichtbaren Zeichen (die man nicht sieht, aber die den Computer stören) durchmischt.

Das Ergebnis ist ein Text, der für uns Menschen genau so aussieht und sich liest wie vorher, aber für die Computer-Algorithmen, die uns ausspionieren wollen, ist er ein undurchdringlicher Nebel.

Warum ist das wichtig?

Wir leben in einer Zeit, in der wir oft unsere Ausweise oder unsere Meinungen online teilen müssen, um Apps nutzen zu dürfen. Diese Daten werden gesammelt, um uns zu manipulieren oder zu überwachen (z. B. um vorherzusagen, was wir kaufen oder wie wir uns verhalten werden).

Dieser Artikel zeigt einen Weg auf, wie wir uns technisch wehren können, ohne unsere Meinung zu ändern. Wir können unsere Texte so „verfälschen", dass die Überwacher ihre Werkzeuge nicht mehr nutzen können. Es ist wie ein Schutzschild aus Tinte: Wir geben die Informationen weiter, aber sie sind so verdreht, dass niemand sie gegen uns verwenden kann.

Kurz gesagt: Wenn die Überwacher denken, sie könnten uns durch unsere Schreibweise lesen, dann geben wir ihnen einen Text, der aussieht wie unser, aber für ihre Maschinen wie ein fremder, unlesbarer Code ist. Wir „vergiften" ihre Daten, um unsere Freiheit zu bewahren.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →