Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst oder gebilligt. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen
Each language version is independently generated for its own context, not a direct translation.
Die große Frage: Hat die KI den „paywall-gesperrten" Kuchen gegessen?
Stellen Sie sich einen riesigen Schüler (die KI) vor, der für eine massive Abschlussprüfung lernt. Um zu lernen, muss dieser Schüler Millionen von Büchern lesen. Einige dieser Bücher sind kostenlos und stehen auf einem öffentlichen Bibliotheksregal (öffentliche Daten). Andere sind hinter einer Paywall gesperrt und nur für Personen verfügbar, die ein Abonnement bezahlen (nicht-öffentliche Daten).
Die große Frage, die dieses Paper stellt, lautet: Hat der Schüler betrogen? Hat er sich in den gesperrten Bereich der Bibliothek geschlichen, um die kostenpflichtigen Bücher zu lesen, obwohl er das nicht durfte?
Das Experiment: Der „Geschmackstest"
Die Forscher haben der KI nicht einfach gefragt: „Hast du das gelesen?", denn die KI könnte lügen oder „Ich weiß es nicht" sagen. Stattdessen haben sie einen cleveren Geschmackstest eingerichtet.
- Das Setup: Sie haben 34 Bücher von O'Reilly Media (einem berühmten Tech-Verlag) ausgewählt. Jedes Buch hat ein kostenloses „Musterkapitel" (öffentlich) und den Rest des Buches hinter einer Paywall (nicht-öffentlich).
- Der Trick: Sie haben einen Absatz aus einem Buch genommen und die KI gebeten, den echten, von Menschen geschriebenen Absatz aus einer Auswahl von vier Optionen zu identifizieren. Die anderen drei Optionen waren gefälschte Absätze, die von einer anderen KI geschrieben wurden, die sehr ähnlich klangen, aber nicht das Original waren.
- Die Logik: Wenn die KI den echten Absatz während ihres Trainings „gesehen" hat, sollte sie ihn leicht erkennen können, wie ein Lied, das man hundertmal gehört hat. Wenn sie ihn nicht gesehen hat, sollte sie nur zufällig raten (wie das Ziehen einer Karte aus einem Deck).
Die Ergebnisse: Wer bestand den Test?
Die Forscher testeten drei verschiedene Versionen von OpenAIs KI-„Schülern":
- Der ältere Schüler (GPT-3.5 Turbo): Dieser Schüler hatte vor zwei Jahren mit dem Lernen aufgehört. Als er an den Büchern getestet wurde, schnitt er nicht besser ab als bei zufälligem Raten. Es schien, als hätte er keine Erinnerung an die kostenpflichtigen Bücher.
- Der kleine Schüler (GPT-4o Mini): Dies ist ein neueres, aber kleineres und weniger leistungsfähiges Modell. Obwohl es zur gleichen Zeit wie der große Schüler trainiert wurde, verhielt es sich ebenfalls wie ein zufälliger Rater. Es konnte den echten Text nicht vom gefälschten Text unterscheiden.
- Der große Schüler (GPT-4o): Dies ist das neueste und leistungsfähigste Modell. Dieser stach heraus. Er identifizierte die echten, von Menschen geschriebenen Absätze aus den kostenpflichtigen Büchern deutlich besser als bei zufälligem Raten.
- Die Punktzahl: Die Forscher gaben ihm eine Punktzahl von 0,82 (wobei 0,5 zufälliges Raten und 1,0 Perfektion bedeutet). Dies deutet darauf hin, dass der große Schüler den Inhalt tatsächlich erkannt hat, auf den er keinen Zugriff haben sollte.
Das „Zeitreise"-Problem (Eine Einschränkung)
Die Forscher waren vorsichtig. Sie befürchteten, dass der große Schüler vielleicht einfach besser darin geworden ist, jegliche menschliche Schrift zu erkennen, und nicht nur die spezifischen Bücher, die sie getestet hatten.
Um dies zu überprüfen, betrachteten sie Bücher, die nach dem Zeitpunkt veröffentlicht wurden, an dem die KI mit dem Lernen aufgehört hatte. Der große Schüler war auch bei diesen neuen Büchern sehr gut darin, menschliche Schrift zu erkennen. Das bedeutet, dass die KI generell besser darin geworden ist, menschlichen Text zu erkennen. Die Tatsache, dass sie jedoch noch besser darin war, die spezifischen alten Bücher zu erkennen, deutet darauf hin, dass sie diese wahrscheinlich während ihres Trainings gesehen hat.
Warum die Ergebnisse nicht zu 100 % sicher sind
Das Paper ist ehrlich bezüglich seiner Grenzen. Stellen Sie es sich wie das Versuch vor, ein Flüstern in einem vollen Raum zu hören:
- Kleine Stichprobengröße: Sie haben nur 34 Bücher getestet. Es ist wie der Versuch, den Geschmack einer ganzen Pizza zu erraten, indem man nur drei Scheiben probiert. Die Ergebnisse sind vielversprechend, aber das „Konfidenzintervall" (ein statistisches Maß für die Sicherheit) ist breit.
- Modellgröße ist entscheidend: Die Tatsache, dass der „kleine Schüler" (Mini) die Bücher nicht erkannt hat, könnte einfach bedeuten, dass er zu klein ist, um sie zu merken, und nicht, dass er sie nicht gesehen hat. Der „große Schüler" hat ein größeres Gedächtnis, sodass er die Information möglicherweise behalten hat, auch wenn er es nicht durfte.
Die Hauptaussage
Die Studie legt nahe, dass OpenAIs fortschrittlichstes Modell (GPT-4o) wahrscheinlich aus urheberrechtlich geschützten Büchern gelernt hat, die hinter einer Paywall lagen, auf die es keinen Zugriff haben sollte.
Die Autoren argumentieren, dass dies die Notwendigkeit von Transparenz unterstreicht. Genau wie ein Schüler in der Lage sein sollte, die Bücher aufzulisten, die er für eine Prüfung gelernt hat, sollten KI-Unternehmen in der Lage sein, genau zu zeigen, welche Daten sie zur Schulung ihrer Modelle verwendet haben. Wenn sie kostenpflichtige Inhalte ohne Erlaubnis oder Zahlung verwenden, entsteht ein Problem für die Menschen, die diese Bücher schreiben, was langfristig möglicherweise die Qualität der auf dem Internet verfügbaren Inhalte beeinträchtigt.
Kurz gesagt: Der „große Schüler" scheint einen Blick auf die gesperrten Bücher geworfen zu haben, während der „kleine Schüler" und der „alte Schüler" es nicht getan haben. Aber da die Klassengröße klein war, müssen wir weitere Beweise prüfen, bevor wir es als definitiven Betrug bezeichnen.
Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?
Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.