The Range Shrinks, the Threat Remains: Re-evaluating LLM Package Hallucinations on the 2026 Frontier-Model Cohort

Diese Arbeit repliziert und erweitert die Studie von Spracklen et al. aus dem Jahr 2025 zu Halluzinationen von Paketen in LLMs unter Verwendung von fünf Frontier-Modellen aus dem Jahr 2026 und zeigt, dass zwar die Halluzinationsraten deutlich gesunken sind und die Varianz zwischen den Modellen enger geworden ist, eine anhaltende Bedrohung jedoch besteht, die durch einen neu identifizierten Satz von 127 modellagnostischen, halluzinierten Paketnamen sowie durch ausgeprägte verhaltensspezifische Muster über Ökosysteme und Modelle hinweg gekennzeichnet ist.

Ursprüngliche Autoren: Aleksandr Churilov (Independent Researcher)

Veröffentlicht 2026-05-19✓ Author reviewed
📖 4 Min. Lesezeit☕ Kaffeepausen-Lektüre

Ursprüngliche Autoren: Aleksandr Churilov (Independent Researcher)

Originalarbeit lizenziert unter CC BY 4.0 (http://creativecommons.org/licenses/by/4.0/). Dies ist eine KI-generierte Erklärung des untenstehenden Papers. Sie wurde nicht von den Autoren verfasst. Für technische Genauigkeit konsultieren Sie das Originalpaper. Vollständigen Haftungsausschluss lesen

Stellen Sie sich vor, Sie sind ein Koch, der versucht, ein neues Rezept zuzubereiten. Sie bitten einen superschlauen, KI-gestützten Sous-Chef um Hilfe. Der Sous-Chef sagt Ihnen selbstbewusst: „Sie müssen SuperSpice-9000 im Lebensmittelgeschäft kaufen!" Sie gehen zum Geschäft, aber SuperSpice-9000 existiert nicht.

In der Welt der Computerprogrammierung ist dieses „Lebensmittelgeschäft" ein digitales Lager namens PyPI (für Python) oder npm (für JavaScript). Diese Lager beherbergen Millionen vorgefertigter Code-Zutaten (Pakete), die Programmierer mit einem einzigen Befehl herunterladen können.

Dieser Artikel ist eine Fortsetzung einer beunruhigenden Geschichte, die im vergangenen Jahr erzählt wurde. Damals stellten Forscher fest, dass KI-Köche sehr schlecht darin waren, Zutaten zu benennen. Sie erfanden etwa 5 % bis 22 % der Zeit falsche Namen wie „SuperSpice-9000". Ein hinterhältiger Dieb könnte ein bösartiges Paket mit diesem erfundenen Namen registrieren, warten, bis ein Programmierer die KI danach fragt, und dann den Programmierer dazu verleiten, einen Virus zu installieren. Dies wird als „Slopsquatting" bezeichnet.

Der Autor dieses Artikels, ein unabhängiger Forscher, fragte: „Hat sich die KI zwei Jahre später in dieser Hinsicht verbessert?"

Hier ist das Ergebnis, einfach erklärt:

1. Das Problem der „falschen Zutaten" wurde kleiner, ist aber nicht verschwunden

Die Forscher testeten die fünf intelligentesten KI-Codierungsmodelle, die Anfang 2026 verfügbar waren (von Unternehmen wie Anthropic, OpenAI, Google und DeepSeek).

  • Die gute Nachricht: Die Lücke zwischen dem „besten" und dem „schlechtesten" KI-Modell hat sich dramatisch verringert. 2024 waren einige KIs schrecklich (22 % falsche Namen), während andere in Ordnung waren (5 %). 2026 sind sie alle ungefähr gleich: Sie erfinden etwa 4,6 % bis 6,1 % der Zeit falsche Namen. Die „Streuung" der Fehlerhaftigkeit ist kollabiert.
  • Die schlechte Nachricht: Die Bedrohung ist immer noch sehr real. Obwohl die Rate gesunken ist, sind 4–6 % immer noch hoch genug, damit ein Dieb Gewinn machen kann. Wenn eine KI in 20 Fällen einmal einen falschen Namen erfindet, kann ein Dieb diesen falschen Namen immer noch registrieren und warten, bis Tausende von Programmierern ihn versehentlich herunterladen.

2. Die Entdeckung des „universellen Fakes"

Dies ist die größte Überraschung des Artikels. Die Forscher fanden 127 spezifische erfundene Namen, die alle fünf Top-KI-Modelle unabhängig voneinander erfanden.

  • Die Analogie: Stellen Sie sich vor, Sie fragen fünf verschiedene Expertenköche: „Was ist die geheime Zutat in dieser Suppe?", und sie sagen alle unabhängig voneinander: „Es ist BlueFlavor-7", obwohl diese Zutat nicht existiert.
  • Die Gefahr: Wenn ein Dieb „BlueFlavor-7" einmal registriert, kann er Benutzer aller fünf KI-Unternehmen gleichzeitig angreifen. Es ist eine „universelle Falle", die nicht davon abhängt, welche KI Sie verwenden.

3. Ein paar seltsame Wendungen

Der Artikel fand einige Muster, die dem Gegenteil dessen entsprachen, was wir erwarteten:

  • Python vs. JavaScript: 2024 war die KI beim Benennen von JavaScript-Zutaten schlechter. 2026 ist sie tatsächlich beim Benennen von Python-Zutaten schlechter. Die KI scheint durch die chaotischen Benennungsregeln von Python verwirrt zu werden.
  • Der „kleine" vs. der „große" Bruder: Normalerweise machen kleinere, günstigere KI-Modelle mehr Fehler als große, teure. Doch hier machte das „kleine" Modell (Claude Haiku) tatsächlich weniger erfundene Namen als sein „großer Bruder" (Claude Sonnet). Es scheint, dass das kleine Modell darauf trainiert wurde, bei Anweisungen besonders vorsichtig zu sein.

4. Warum ist das Problem geschrumpft?

Der Autor schlägt drei Gründe vor, warum die KI jetzt etwas besser ist:

  1. Chancengleichheit: Die „Open-Source"-Modelle (kostenlos nutzbar) sind so gut geworden, dass sie nun genauso intelligent sind wie die „kommerziellen" Modelle (kostenpflichtig), sodass sich die Lücke zwischen ihnen geschlossen hat.
  2. Besseres Training: Die Unternehmen, die der KI Daten zuführen, scheinen ihre „Kochbücher" (Trainingsdaten) bereinigt zu haben, um mehr erfundene Zutatenamen zu entfernen.
  3. Standardisiertes Training: Alle großen KI-Unternehmen verwenden jetzt ähnliche Lehrmethoden, sodass sie alle ähnliche (etwas bessere) Fehler machen.

Das Fazit

Die KI-Köche haben ihr Verhalten ein wenig bereinigt, aber sie erfinden immer noch oft genug falsche Zutaten, um gefährlich zu sein. Das Besorgniserregendste ist, dass sie alle dieselben erfundenen Zutaten erfinden.

Was der Artikel NICHT sagt:

  • Er sagt nicht, dass dies ein gelöstes Problem ist.
  • Er sagt nicht, dass Sie die KI nicht mehr verwenden sollten.
  • Er behauptet nicht, dass alle KI-Modelle schlecht sind (sie testeten nur die Top 5 „Frontier"-Modelle; kleinere, ältere Modelle könnten immer noch viel schlimmer sein).

Die Hauptbotschaft des Autors lautet: Der Fehlerbereich hat sich verkleinert, aber die Bedrohung bleibt bestehen. Programmierer und Sicherheitsteams müssen sich bewusst sein, dass selbst die intelligentesten KIs von heute Sie immer noch zu einem gefälschten, gefährlichen Download führen können.

Ertrinken Sie in Arbeiten in Ihrem Fachgebiet?

Erhalten Sie tägliche Digests der neuesten Arbeiten passend zu Ihren Forschungsbegriffen — mit technischen Zusammenfassungen, in Ihrer Sprache.

Digest testen →