Human-AI Collaboration for Scaling Agile Regression Testing: An Agentic-AI Teammate from Manual to Automated Testing

Dit paper presenteert een agentic-AI-systeem dat in samenwerking met Hacon (Siemens) automatisch testscripts genereert op basis van specificaties, waardoor de regressietestcapaciteit in agile omgevingen aanzienlijk wordt verhoogd terwijl menselijke toezicht en kwaliteit behouden blijven.

Moustapha El Outmani, Manthan Venkataramana Shenoy, Ahmad Hatahet, Andreas Rausch, Tim Niklas Kniep, Thomas Raddatz, Benjamin King

Gepubliceerd Tue, 10 Ma
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een gigantisch, levend gebouw bouwt: een softwareprogramma voor treinen en buslijnen. Elke week komen er nieuwe kamers, nieuwe deuren en nieuwe regels bij. Om te zorgen dat het hele gebouw veilig blijft, moeten de bouwmeesters (de ontwikkelaars) constant controleren of de oude deuren nog goed sluiten en of de nieuwe deuren niet de oude muren beschadigen. Dit noemen ze regressietesten.

In het verleden deden mensen dit handmatig. Ze liepen door het gebouw, openden deuren en schreven op wat er gebeurde. Maar het gebouw groeide zo snel, dat de mensen niet meer bij konden. Ze schreven meer testregels dan dat ze er tijd voor hadden om ze uit te voeren. Het resultaat? Een enorme berg werk en vertraging.

Hier komt dit onderzoek van Hacon (een Siemens-bedrijf) en de TU Clausthal in beeld. Ze hebben een AI-assistent bedacht die fungeert als een "stille teamgenoot". Laten we dit uitleggen met een paar creatieve vergelijkingen.

1. Het Probleem: De "Schrijvers" vs. De "Bouwers"

Stel je voor dat je een team hebt van architecten (die de testregels schrijven) en bouwers (die de tests in de computer zetten).

  • De architecten zijn razendsnel. Ze tekenen elke dag nieuwe plannen.
  • De bouwers zijn traag. Het kost hen veel tijd om die plannen om te zetten in echte, werkende muren en deuren (de scripts).
  • Het resultaat: Er ligt een enorme berg ongebruikte plannen op de grond. De bouw vertraagt.

2. De Oplossing: De "AI-Bouwknecht"

De onderzoekers hebben een AI-teamgenoot gebouwd. Denk hierbij niet aan een robot die de hele bouw overneemt, maar meer als een super-snelle, maar nog wat onervaren leerling-bouwknecht.

  • Hoe werkt het? De architecten geven hun plannen (testregels) aan de AI. De AI pakt deze plannen, kijkt naar oude, werkende bouwplannen in de archieven (dit noemen ze Retrieval-Augmented Generation of RAG), en probeert zelf een eerste versie van de bouwplannen te maken.
  • De "Stille" Teamgenoot: De AI werkt 's nachts of in de achtergrond. Ze maakt geen lawaai in het kantoor. Als de menselijke bouwers 's ochtends komen, ligt er al een stapel met eerste concepten klaar.

3. De Samenwerking: De Mens als Hoofdbouwer

Dit is het belangrijkste deel: De AI bouwt niet alleen.

  • De AI maakt een "eerste opzet". Het is alsof de AI een ruwe schets maakt van een kamer. De muren staan er, de ramen zijn er, maar de verf is misschien verkeerd en de deuren hangen scheef.
  • De menselijke bouwer (de testengineer) kijkt naar deze schets. Ze zeggen: "Goed gedaan, AI! Maar deze deur moet hier staan, en we gebruiken een andere verf."
  • Het resultaat: De mens hoeft niet meer bij nul te beginnen. Ze hoeven alleen maar te verbeteren en controleren. Dit bespaart enorm veel tijd.

4. Wat leerden ze? (De Lessen)

Uit het onderzoek kwamen een paar belangrijke lessen naar voren, die we kunnen vergelijken met het werken met een nieuwe stagiair:

  • De instructies moeten perfect zijn: Als de architect (de mens) een vaag plan schrijft ("Zet ergens een raam"), maakt de AI een raam op een rare plek. De AI begrijpt geen "onzichtbare regels" die mensen wel begrijpen. Mensen moeten heel duidelijk zijn.
  • De AI is letterlijk: De AI doet precies wat er staat, maar mist de "geest" van de zaak. Soms maakt de AI iets dat technisch klopt, maar niet slim is. De mens moet de "slimme knoppen" er nog op drukken.
  • De mens is de chef: De AI mag nooit zelf beslissen of een gebouw veilig is. De mens moet altijd de laatste handtekening zetten. De AI is een hulpmiddel, geen vervanging.
  • Samen leren: De mensen leerden van de AI (ze werden sneller in het controleren) en de AI leerde van de mensen (door hun feedback te gebruiken). Dit noemen ze "co-adaptatie": ze groeien samen.

Conclusie

Kortom: Dit onderzoek laat zien dat je een AI-assistent kunt gebruiken om de enorme berg werk van het omzetten van testregels naar werkende software te verkleinen.

Het is alsof je een snelle, maar wat stijve stagiair hebt die de zware, saaie klusjes doet (het schrijven van de eerste versie), zodat jij als ervaren meester-bouwer je tijd kunt besteden aan het controleren van de kwaliteit en het maken van slimme keuzes. Het maakt het bouwen van software sneller, maar het vereist wel dat je als mens duidelijk blijft in wat je wilt en dat je nooit je verantwoordelijkheid uit handen geeft.