Each language version is independently generated for its own context, not a direct translation.
Schätzung von Software-Aufgaben mit KI: Ein einfacher Überblick
Stellen Sie sich vor, Sie leiten ein Team von Bauarbeitern, die ein riesiges Haus bauen sollen. Bevor sie loslegen, müssen sie einschätzen: „Wie lange dauert es, die Küche zu verlegen? Wie schwer ist es, das Dach zu decken?" In der Softwareentwicklung nennt man diese Einschätzung „Story Points". Es ist keine genaue Zeitangabe (wie „3 Stunden"), sondern eher ein Gefühl für den Aufwand: Ist das ein kleines „1er"-Projekt oder ein riesiges „13er"-Monster?
Normalerweise sitzen die Entwickler zusammen, diskutieren und werfen imaginäre Pokerchips in die Luft, um sich zu einigen. Das dauert lange und ist oft subjektiv.
Diese Studie fragt nun: Kann eine Künstliche Intelligenz (KI), genauer gesagt ein „Large Language Model" (LLM), das besser und schneller machen? Und zwar ohne dass wir ihr erst tausende Beispiele zeigen müssen?
Hier ist die Geschichte der Studie, einfach erklärt:
1. Das Problem: Der leere Rucksack
Früher mussten Computermodelle lernen, indem man ihnen hunderte von Beispielen zeigte: „Hier ist Aufgabe A, sie hat 5 Punkte. Hier ist Aufgabe B, sie hat 8 Punkte." Das ist wie ein Schüler, der erst 1000 Matheaufgaben lösen muss, bevor er eine neue versteht.
Das Problem: In der echten Welt hat man oft keine 1000 Beispiele. Neue Projekte starten bei Null. Die KI steht mit einem leeren Rucksack da.
2. Die Lösung: Der „Allwissende" KI-Assistent
Die Forscher haben vier sehr starke KI-Modelle (wie DeepSeek, Kimi, Gemini und OpenAI) getestet. Diese Modelle haben bereits Millionen von Büchern, Code und Diskussionen im Internet gelesen. Sie sind wie Super-Schüler, die alles schon einmal irgendwo gehört haben.
Die Frage war: Können diese Super-Schüler eine neue Aufgabe einschätzen, ohne dass wir ihnen vorher Beispiele zeigen? (Das nennt man Zero-Shot).
Das Ergebnis: Ja! Die KI konnte Aufgaben schon ziemlich gut einschätzen, nur weil sie so viel „Weltwissen" hat. Sie lag oft besser als ein Computermodell, das erst mühsam mit 80 % aller Daten eines Projekts trainiert wurde.
3. Der kleine Trick: Ein paar Beispiele reichen
Was passiert, wenn wir der KI nur fünf kleine Beispiele geben? (Das nennt man Few-Shot).
Stellen Sie sich vor, Sie sagen der KI: „Schau mal, diese Aufgabe hier war leicht (3 Punkte), diese hier war schwer (13 Punkte)."
Das Ergebnis: Das war wie ein Blitzlicht für die KI! Die Genauigkeit verbesserte sich enorm.
- Wichtiges Detail: Es war besser, Beispiele zu wählen, die die ganze Bandbreite abdecken (eine sehr leichte, eine mittlere, eine sehr schwere), als nur die häufigsten Beispiele zu nehmen. Es ist wie beim Kalibrieren einer Waage: Man braucht Gewichte von 1 kg bis 100 kg, nicht nur viele 1-kg-Gewichte.
4. Der Vergleich: Ist „Vergleichen" einfacher als „Zählen"?
Es gibt eine alte Theorie: Menschen finden es leichter zu sagen: „Aufgabe A ist schwerer als Aufgabe B", als eine genaue Punktzahl zu nennen. (Wie beim Weinproben: „Dieser Wein ist besser als jener" ist einfacher als „Dieser Wein hat 92 Punkte").
Die Forscher haben die KI getestet:
- Frage: Ist es für die KI einfacher, zwei Aufgaben zu vergleichen, oder eine Punktzahl zu nennen?
- Ergebnis: Nein! Im Gegensatz zu Menschen ist es für die KI nicht einfacher, zu vergleichen. Die KI scheint im Inneren immer noch wie ein Mathematiker zu denken, der Zahlen berechnet, auch wenn man sie nur zum Vergleichen auffordert. Sie mag die direkte Punktzahl lieber.
ABER: Auch wenn das Vergleichen für die KI nicht „einfacher" ist, kann man diese Vergleiche trotzdem nutzen! Wenn man der KI fünf Beispiele gibt, bei denen steht: „Aufgabe A ist schwerer als B", hilft das der KI trotzdem, ihre Schätzungen zu verbessern. Es ist wie ein Gerüst, das ihr hilft, sich zu orientieren.
5. Was bedeutet das für die Praxis?
- Keine Angst vor neuen Projekten: Man muss nicht warten, bis man genug Daten hat. Eine moderne KI kann sofort helfen, auch am ersten Tag eines Projekts.
- Wenig Aufwand, viel Gewinn: Wenn man der KI nur fünf kleine Beispiele (oder fünf Vergleiche) gibt, wird sie zum Experten für genau dieses Projekt.
- Nicht jede KI ist gleich: Manche KIs (wie DeepSeek) brauchen klare Zahlenbeispiele. Andere, leichtere KIs (wie Gemini) profitieren sogar mehr davon, wenn man ihnen nur sagt: „Das ist schwerer als das".
- Die KI ist kein Mensch: Menschen finden Vergleiche intuitiv. KIs sind wie Rechenmaschinen, die auch Vergleiche in Zahlen umwandeln. Aber das Ergebnis ist trotzdem gut!
Fazit
Diese Studie zeigt, dass wir KI nutzen können, um den langweiligen und schwierigen Teil der Softwareplanung zu automatisieren. Wir müssen der KI nicht alles beibringen; sie bringt schon viel mit. Mit ein paar kleinen Hinweisen (den „Few-Shot"-Beispielen) wird sie zum perfekten Assistenten, der hilft, den Aufwand für Softwareprojekte realistisch einzuschätzen – schneller, günstiger und oft genauer als bisherige Methoden.
Es ist, als hätte man einen erfahrenen Architekten, der sofort weiß, wie schwer ein Bau ist, nur weil er schon tausende Häuser gesehen hat, und mit ein paar kurzen Hinweisen auf den Bauplan perfekt wird.