Building AI Coding Agents for the Terminal: Scaffolding, Harness, Context Engineering, and Lessons Learned

Each language version is independently generated for its own context, not a direct translation.

Stellen Sie sich vor, Sie haben einen hochintelligenten, aber etwas vergesslichen Assistenten, der Ihnen beim Programmieren helfen soll. Früher saß dieser Assistent immer direkt in Ihrer Entwicklungsumgebung (dem IDE) und wartete darauf, dass Sie ihm sagen, was zu tun ist.

Das Papier beschreibt OPENDEV, ein neues, revolutionäres Konzept: Ein KI-Assistent, der direkt in Ihrem Terminal (der Kommandozeile) lebt und eigenständig arbeitet. Er ist nicht nur ein Tipphilfe-Tool, sondern ein echter "Agent", der ganze Projekte planen, Code schreiben, testen und Fehler beheben kann – fast wie ein menschlicher Kollege, der an Ihrem Computer sitzt.

Hier ist die Erklärung der wichtigsten Ideen, übersetzt in einfache Bilder und Metaphern:

1. Das Problem: Der "Vergessliche" und der "Explosive"

KI-Modelle sind wie Genies mit einem sehr kurzen Gedächtnis.

Das Gedächtnis-Problem: Wenn ein Gespräch zu lang wird, vergisst die KI die Anfangsinstruktionen. Sie weiß plötzlich nicht mehr, dass sie niemals Dateien löschen darf oder dass sie immer Tests schreiben soll.
Das Sicherheits-Problem: Wenn die KI Zugriff auf Ihre Kommandozeile hat, kann sie theoretisch alles löschen (z. B. rm -rf /). Man muss sie also so steuern, dass sie nicht aus Versehen das Haus abbrennt.

2. Die Lösung: OPENDEV als "Baukasten-System"

OPENDEV ist nicht eine einzelne KI, die alles allein macht. Es ist eher wie eine Baustelle mit einem erfahrenen Bauleiter und spezialisierten Handwerkern.

A. Der "Baukasten" (Compound AI System)

Statt einen einzigen riesigen Roboter zu bauen, nutzt OPENDEV verschiedene kleine KIs für verschiedene Aufgaben:

Der Denker: Ein KI-Modell, das nur nachdenkt und Pläne schmiedet (ohne zu handeln).
Der Akteur: Ein KI-Modell, das die Hände in die Hand nimmt und Code schreibt.
Der Kritiker: Ein KI-Modell, das den Plan des Denkers überprüft, bevor der Akteur loslegt.
Der Seher: Eine KI, die Screenshots lesen kann.

Die Metapher: Stellen Sie sich vor, Sie wollen ein Haus bauen. Sie schicken nicht einen einzigen Handwerker los, der alles von der Fundamentgrube bis zum Dach machen soll. Stattdessen haben Sie einen Architekten (Denker), der den Plan macht, einen Bauarbeiter (Akteur), der baut, und einen Bauleiter (Kritiker), der prüft, ob alles stimmt. Jeder nutzt das Werkzeug, das er am besten beherrscht.

B. Der "Gedächtnis-Trick" (Context Engineering)

Da das KI-Gedächtnis begrenzt ist, muss OPENDEV clever damit umgehen.

Adaptive Komprimierung: Stellen Sie sich vor, Sie führen ein Gespräch. Am Anfang ist alles wichtig. Nach 50 Sätzen sind die ersten Sätze weniger wichtig. OPENDEV fasst die alten Teile des Gesprächs automatisch zusammen (wie ein guter Zuhörer, der sagt: "Du hast vorhin über das Fundament gesprochen, das ist erledigt").
Der "Notizblock" (Scratchpad): Wenn eine Datei zu groß ist, um sie im Gedächtnis zu behalten, schreibt die KI den Inhalt in eine externe Datei und merkt sich nur: "Die Datei ist da, ich kann sie nachlesen, wenn ich muss." Das spart Platz im Gedächtnis.
Erinnerungs-Zettelchen (System Reminders): Damit die KI nicht vergisst, was sie soll, hakt das System kleine Erinnerungen direkt vor die nächste Frage. Statt den ganzen Regelkatalog am Anfang zu wiederholen, flüstert das System ihr kurz zu: "Vergiss nicht, vor dem Speichern zu testen!" genau in dem Moment, wo sie es braucht.

C. Die "Sicherheitsbarrieren" (Safety)

Wie verhindert man, dass die KI das Haus abbricht?

Die "Werkzeugkiste": Wenn die KI einen Plan macht (Plan-Modus), bekommt sie eine Werkzeugkiste, in der nur Werkzeuge zum Ansehen enthalten sind (Lesen, Suchen). Werkzeuge zum Zerstören (Löschen, Überschreiben) fehlen einfach. Sie kann gar nicht zerstören, weil sie das Werkzeug nicht sieht.
Die "Sicherheitskontrolle": Bevor die KI einen gefährlichen Befehl ausführt (z. B. "Server neu starten"), muss sie erst bei Ihnen (dem Menschen) anfragen.
Der "Rückgängig-Knopf": Jedes Mal, wenn die KI etwas ändert, macht sie ein Foto davon (ein "Snapshot"). Wenn sie etwas falsch macht, können Sie mit einem Klick alles auf den Zustand vor der Änderung zurücksetzen.

3. Wie funktioniert das im Alltag?

Stellen Sie sich vor, Sie sagen zu OPENDEV: "Ich brauche eine neue Login-Funktion für meine App."

Planung: OPENDEV denkt erst nach (oder schickt einen "Planer"-Bot los), liest den bestehenden Code und erstellt einen Schritt-für-Schritt-Plan.
Genehmigung: Es zeigt Ihnen den Plan: "Ich werde erst die Datenbank prüfen, dann die Datei X ändern und dann Tests schreiben. Passt das?"
Ausführung: Wenn Sie "Ja" sagen, führt ein anderer Bot die Schritte aus. Er liest Dateien, schreibt Code und führt Tests aus.
Fehlerbehandlung: Wenn ein Test fehlschlägt, liest er den Fehler, denkt nach, korrigiert den Code und versucht es erneut – ohne dass Sie etwas tun müssen.
Parallelarbeit: Wenn es viele unabhängige Aufgaben gibt (z. B. "Prüfe Modul A und Modul B"), schickt OPENDEV zwei kleine Bots gleichzeitig los, die parallel arbeiten, statt nacheinander.

4. Warum ist das wichtig?

Bisher waren KI-Helfer oft wie "Co-Piloten", die nur Vorschläge machten, aber Sie mussten alles selbst bestätigen und ausführen. OPENDEV ist wie ein selbstständiger Mitarbeiter, der im Terminal arbeitet.

Sicherheit: Es ist so gebaut, dass es nicht versehentlich Schaden anrichtet (durch die Werkzeug-Filter und Bestätigungen).
Lange Aufgaben: Es kann Aufgaben erledigen, die Stunden dauern, ohne den Faden zu verlieren (durch die cleveren Gedächtnis-Tricks).
Flexibilität: Es kann mit verschiedenen KI-Modellen arbeiten. Wenn morgen eine bessere KI auf den Markt kommt, muss man nur die Einstellung ändern, nicht den ganzen Code neu schreiben.

Fazit

OPENDEV ist der Versuch, die KI vom "passiven Tippgeber" zum "aktiven Handwerker" zu machen. Es nutzt eine Architektur aus vielen kleinen, spezialisierten KI-Teilen, die wie ein gut organisiertes Team zusammenarbeiten, um komplexe Software-Probleme zu lösen, während es gleichzeitig sicherstellt, dass nichts kaputtgeht und das Gedächtnis nicht überläuft. Es ist der Schritt von "KI hilft mir tippen" zu "KI arbeitet mit mir".

Building AI Coding Agents for the Terminal: Scaffolding, Harness, Context Engineering, and Lessons Learned

1. Das Problem: Der "Vergessliche" und der "Explosive"

2. Die Lösung: OPENDEV als "Baukasten-System"

A. Der "Baukasten" (Compound AI System)

B. Der "Gedächtnis-Trick" (Context Engineering)

C. Die "Sicherheitsbarrieren" (Safety)

3. Wie funktioniert das im Alltag?

4. Warum ist das wichtig?

Fazit

1. Problemstellung

2. Methodik und Architektur (OPENDEV)

A. Scaffolding (Gerüstbau) & Agent Core

B. Context Engineering (Kontext-Management)

C. Tool-System & Sicherheit

D. Persistenz

3. Schlüsselbeiträge

4. Ergebnisse und Lessons Learned

5. Bedeutung

Building AI Coding Agents for the Terminal: Scaffolding, Harness, Context Engineering, and Lessons Learned

1. Das Problem: Der "Vergessliche" und der "Explosive"

2. Die Lösung: OPENDEV als "Baukasten-System"

A. Der "Baukasten" (Compound AI System)

B. Der "Gedächtnis-Trick" (Context Engineering)

C. Die "Sicherheitsbarrieren" (Safety)

3. Wie funktioniert das im Alltag?

4. Warum ist das wichtig?

Fazit

1. Problemstellung

2. Methodik und Architektur (OPENDEV)

A. Scaffolding (Gerüstbau) & Agent Core

B. Context Engineering (Kontext-Management)

C. Tool-System & Sicherheit

D. Persistenz

3. Schlüsselbeiträge

4. Ergebnisse und Lessons Learned

5. Bedeutung

Mehr davon

Holos: A Web-Scale LLM-Based Multi-Agent System for the Agentic Web

Xpertbench: Expert Level Tasks with Rubrics-Based Evaluation

Compositional Neuro-Symbolic Reasoning

Understanding the Nature of Generative AI as Threshold Logic in High-Dimensional Space

AIVV: Neuro-Symbolic LLM Agent-Integrated Verification and Validation for Trustworthy Autonomous Systems