CARE Drive A Framework for Evaluating Reason-Responsiveness of Vision Language Models in Automated Driving

Each language version is independently generated for its own context, not a direct translation.

CARE-Drive: De "Gewetenscheck" voor Slimme Auto's

Stel je voor dat je een zelfrijdende auto hebt die niet alleen kan rijden, maar ook kan praten. Deze auto gebruikt een superintelligente hersencomputer (een zogenaamd 'Vision-Language Model') om de weg te bekijken en beslissingen te nemen. Maar hier zit een probleem: de auto kan heel goed uitleggen waarom hij iets doet, maar is die uitleg echt de reden van zijn keuze, of is het gewoon een slimme smoesje dat hij achteraf bedenkt?

Dit is als een kind dat zegt: "Ik heb de koekjes niet gegeten omdat ik honger had," terwijl het eigenlijk gewoon de koekjes wilde hebben. We weten niet of het kind echt honger had of dat het gewoon een goed excuus bedacht.

In de wereld van zelfrijdende auto's is dit gevaarlijk. Als een auto een beslissing neemt (bijvoorbeeld: "Ik passeer die fietser"), moeten we zeker weten dat hij dat doet omdat het veilig en logisch is, en niet omdat hij toevallig een bepaald pad in zijn computer heeft gevolgd.

Wat is CARE-Drive?

De onderzoekers van de TU Delft hebben CARE-Drive bedacht. De naam staat voor Context-Aware Reasons Evaluation for Driving. In het Nederlands kunnen we het zien als een "Gewetenscheck" of een "Motivatie-test" voor de auto.

Het doel is simpel: Kijkt de auto echt naar de goede redenen voordat hij iets doet?

Hoe werkt het? (De Analogie van de Chef-kok)

Stel je de zelfrijdende auto voor als een chef-kok in een restaurant.

De oude manier: Je vraagt de chef om een gerecht te maken. Hij doet het. Je proeft het en zegt: "Mmm, lekker." Maar je weet niet of hij de juiste ingrediënten gebruikte of dat hij gewoon toevallig iets lekkers maakte.
De CARE-Drive manier: Je geeft de chef een lijst met specifieke regels en redenen (bijvoorbeeld: "We moeten rekening houden met de gezondheid van de gast, maar ook met de snelheid van het eten"). Vervolgens laat je de chef koken in verschillende situaties (soms is er haast, soms is er een gast met een allergie).

CARE-Drive kijkt dan niet alleen of het eten lekker is, maar verandert de auto zijn gedrag als jij de regels verandert?

Als je zegt: "Er is een gast die haast heeft", moet de auto sneller gaan (of juist niet, als dat onveilig is).
Als je zegt: "Er komt een auto aan", moet de auto wachten.

Als de auto zijn gedrag aanpast op basis van deze nieuwe "redenen", dan is hij responsief. Hij luistert echt. Als hij hetzelfde blijft doen, ongeacht wat je zegt, dan is hij doof en zijn zijn uitleggen misschien wel leugens.

De Test: De Fietser op de Weg

In dit onderzoek hebben ze een specifieke situatie getest: een auto die achter een fietser rijdt.

Het dilemma: De auto mag volgens de wet niet inhalen (er is een dubbel geel streepje), maar de fietser rijdt langzaam en de auto staat er al een tijdje achter. Moet de auto wachten (veilig, maar ongeduldig) of inhalen (onveilig volgens de wet, maar efficiënt)?

De onderzoekers gaven de auto verschillende "redenen" mee in zijn instructie:

Veiligheid: "Kijk uit voor de tegenliggers."
Sociale druk: "Er staat een auto achter je die ongeduldig is."
Efficiëntie: "De passagier heeft haast."

Wat ontdekten ze?

Zonder instructies is de auto een "regels-robot": Als je de auto niets vertelt, doet hij alleen wat de wet zegt. Hij wacht eindeloos achter de fietser, zelfs als het veilig zou zijn om in te halen. Hij denkt niet na.
Met "menselijke redenen" wordt hij slimmer: Als je de auto vertelt: "Hé, we moeten ook rekening houden met comfort en efficiëntie, zolang het veilig is," dan begint hij te twijfelen en soms wel in te halen.
Hij reageert op de situatie:
- Als er een auto aan komt (veiligheidsrisico), wacht hij.
- Als er een auto achter hem staat (sociale druk), probeert hij sneller in te halen.
- Maar... als de passagier haast heeft, wordt de auto juist voorzichtiger! Hij denkt blijkbaar: "Haast betekent gevaar, dus ik wacht liever." Dit is een verrassend menselijke reactie.

Waarom is dit belangrijk?

Vroeger keken we alleen of een auto niet crashte. Dat is goed, maar niet genoeg. We willen auto's die begrijpen waarom ze iets doen.

CARE-Drive is als een test voor het geweten van de computer. Het bewijst dat we kunnen checken of een slimme auto echt luistert naar menselijke waarden (zoals veiligheid, comfort en regels) en daar zijn beslissingen op aanpast.

De conclusie in één zin:
CARE-Drive laat zien dat we zelfrijdende auto's niet alleen kunnen testen op of ze niet crashen, maar ook op of ze echt "nadenken" over de juiste redenen om te rijden, net zoals een goede menselijke bestuurder dat doet. Het is een stap richting auto's die niet alleen slim zijn, maar ook betrouwbaar en menselijk in hun keuzes.

Each language version is independently generated for its own context, not a direct translation.

Titel: CARE-Drive: Een Kader voor het Evalueren van Reden-Responsiviteit van Vision-Language Modellen in Geautomatiseerd Vervoer

Auteurs: Lucas Elbert Suryana et al. (TU Delft)
Doel: Het ontwikkelen van een methodologie om te bepalen of Vision-Language Models (VLMs) in geautomatiseerd rijden daadwerkelijk reageren op menselijke redenen (zoals veiligheid, wetmatigheid, comfort) of dat hun uitleg slechts post-hoc rationalisaties zijn.

1. Het Probleem

Geautomatiseerd rijden onderzoekt steeds vaker het gebruik van foundation modellen, zoals Vision-Language Models (VLMs), om verkeerssituaties te interpreteren en beslissingen te nemen met natuurlijke taal-uitleg. Echter, de huidige evaluatiemethoden richten zich voornamelijk op uitkomst-gebaseerde metrics (bijv. botsingspercentage, trajectnauwkeurigheid).

Dit leidt tot twee kritieke tekortkomingen:

Ontbreken van Reden-Responsiviteit: Het is onduidelijk of de beslissingen van het model daadwerkelijk worden beïnvloed door menselijke redenen (zoals veiligheidsmarges of sociale druk) of dat de gegenereerde uitleg slechts een plausibel verhaal is dat na de beslissing wordt bedacht (post-hoc rationalization).
Risico op Valse Zekerheid: In veiligheidskritieke domeinen kan dit leiden tot "Meaningful Human Control" (MHC) die niet wordt gehaald. Als een systeem uitleg geeft die lijkt op menselijk redeneren, maar de beslissingen niet aanpast op basis van die redenen, ontstaat er een gevaarlijke kloof tussen wat het systeem zegt en wat het doet.

Er is geen bestaand framework om te testen of expliciete, mensgerichte redenen de beslissingsgedraging van een VLM causaal beïnvloeden zonder de modelparameters te wijzigen.

2. Methodologie: Het CARE-Drive Kader

CARE-Drive (Context-Aware Reasons Evaluation for Driving) is een model-onafhankelijk (model-agnostic) kader dat de tracking-condition van Meaningful Human Control operationaliseert. Het kader vergelijkt beslissingen van een model onder een basisconditie met beslissingen waarbij expliciete menselijke redenen zijn toegevoegd, onder gecontroleerde variatie van de context.

Het proces bestaat uit twee fasen:

Fase 1: Prompt Calibratie (Stabiliteit)

Doel: Identificeren van de meest stabiele en expert-gealigneerde prompt-configuratie (Model + Redeneerstrategie) voordat contextuele sensitiviteit wordt getest.

Variabelen:
- Model (M): Verschillende VLM's (bijv. GPT-4.1, mini, nano).
- Denkstrategie (T): Geen-denken, Chain-of-Thought (CoT), Tree-of-Thought (ToT).
- Redenen (R): Een gestructureerde set van 13 normatieve redenen (veiligheid, wet, comfort, efficiëntie, etc.) die als prompt worden ingevoerd.
Doelwit: Het vinden van een configuratie $(M^*, T^*)$ die consistent de beslissing van experts nabootst (in dit geval: inhalen van een fietser ondanks een dubbele gele lijn, mits veilig).
Resultaat: Alleen configuraties die stabiel zijn en de expert-beslissing volgen, gaan door naar Fase 2.

Fase 2: Contextuele Evaluatie (Sensitiviteit)

Doel: Meten hoe gevoelig het gekalibreerde model is voor veranderingen in de waarneembare context.

Gebruiksscenario: Inhalen van een fietser op een tweebaansweg met tegenliggers.
Variabele Context (O):
- TTCo (Time-to-Collision): Veiligheidsmarge met tegenliggers.
- B (Voertuig erachter): Sociale druk (is er een auto die wacht?).
- U (Passagiershaast): Efficiëntiedruk (is de passagier haastig?).
- F (Volgtijd): Hoe lang wordt er al achter de fietser gereden (oncomfort/geduld).
- L (Uitleglengte): Beperking van de redeneerruimte (korte zin vs. onbeperkt).
Methode: Een full-factorial analyse waarbij de VLM 30 keer wordt uitgevoerd per combinatie. De uitkomst is binair: inhalen (1) of achterblijven (0).
Statistiek: Een binair logit-model (logistische regressie) wordt gebruikt om de invloed van elke variabele op de inhaalkans te kwantificeren (odds ratios).

3. Belangrijkste Bijdragen

Het CARE-Drive Kader: Een nieuw, model-onafhankelijk evaluatiekader dat specifiek is ontworpen om reden-responsiviteit te meten in plaats van alleen uitkomst-accuraatheid.
Methodologische Innovatie: Een tweestapsprocedure die prompt-stabiliteit isoleert van context-afhankelijke redeneereffecten, waardoor het mogelijk is om te testen of redenen causaal de beslissing beïnvloeden.
Empirisch Bewijs: Een systematische studie die aantoont dat expliciete menselijke redenen de beslissingen van VLMs kunnen verschuiven richting expert-aanbevolen gedrag, maar dat deze responsiviteit ongelijk verdeeld is over verschillende contextfactoren.
Operationalisatie van MHC: Het biedt een praktische methode om te controleren of geautomatiseerde systemen zich gedragen volgens de principes van "Meaningful Human Control" zonder het model opnieuw te hoeven trainen.

4. Resultaten

De studie werd uitgevoerd in een simulatie (CARLA) en geanalyseerd met statistische modellen.

Invloed van Redenen: Zonder expliciete menselijke redenen ( $R = \emptyset$ ) koos het model in 100% van de gevallen voor strikte wetgevolging (niet inhalen). Met expliciete redenen ( $R \neq \emptyset$ ) verschuift het model naar expert-gealigneerd gedrag (inhalen als veilig), wat aantoont dat redenen de beslissing beïnvloeden.
Optimale Configuratie: De combinatie van GPT-4.1 met Tree-of-Thought (ToT) bleek het meest robuust en consistent met expert-adviezen, vooral in veiligheidskritieke situaties (tegenliggers). Chain-of-Thought (CoT) was minder stabiel onder druk.
Contextuele Sensitiviteit (Logit-analyse):
- Veiligheid (TTCo): Had de sterkste positieve invloed. Een grotere veiligheidsmarge verhoogde de kans op inhalen aanzienlijk (Odds Ratio > 20).
- Sociale Druk (Voertuig erachter): Verhoogde de kans op inhalen (Odds Ratio ~3.8), wat aangeeft dat het model reageert op sociale druk.
- Passagiershaast (U): Verwachtte een hogere inhaalkans, maar het model werd juist conservatiever (lagere kans). Dit suggereert dat het model veiligheid prioriteert boven efficiëntie als er geen directe veiligheidsdreiging is.
- Volgtijd (F): Geen statistisch significant effect op de beslissing.
- Uitleglengte (L): Een beperkte uitleg (korte zinnen) onderdrukte de inhaalkans drastisch (Odds Ratio ~0.015), wat aangeeft dat "redeneerruimte" essentieel is voor complexe afwegingen.
Validatie: De beslissingen van het gekalibreerde model werden succesvol vertaald naar uitvoerbaar gedrag in de CARLA-simulatie.

5. Betekenis en Conclusie

CARE-Drive levert het eerste empirische bewijs dat foundation modellen in geautomatiseerd rijden systematisch kunnen worden geëvalueerd op hun vermogen om te reageren op menselijke redenen.

Bevestiging: Het is mogelijk om te testen of een AI-systeem "zint" op menselijke redenen zonder de interne architectuur te openen of te wijzigen.
Beperkingen: De responsiviteit is niet uniform; het model reageert sterk op veiligheidsfactoren, maar minder voorspelbaar op efficiëntie- of sociale factoren (zoals passagiershaast).
Toekomst: Dit kader biedt een basis voor het diagnosticeren van AI-systemen in veiligheidskritieke domeinen en helpt ervoor te zorgen dat geautomatiseerde beslissingen niet alleen veilig zijn, maar ook verantwoord en mensgericht redeneren.

Het paper concludeert dat expliciete normatieve begeleiding de uitlijning tussen VLM-beslissingen en menselijke verwachtingen kan verbeteren, maar dat er nog werk moet worden verricht om de responsiviteit op alle soorten redenen consistent te maken.

CARE Drive A Framework for Evaluating Reason-Responsiveness of Vision Language Models in Automated Driving

Titel: CARE-Drive: Een Kader voor het Evalueren van Reden-Responsiviteit van Vision-Language Modellen in Geautomatiseerd Vervoer

1. Het Probleem

2. Methodologie: Het CARE-Drive Kader

Fase 1: Prompt Calibratie (Stabiliteit)

Fase 2: Contextuele Evaluatie (Sensitiviteit)

3. Belangrijkste Bijdragen

4. Resultaten

5. Betekenis en Conclusie

Meer zoals dit

OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains

From Business Events to Auditable Decisions: Ontology-Governed Graph Simulation for Enterprise AI

Interpretable Tau-PET Synthesis from Multimodal T1-Weighted and FLAIR MRI Using Partial Information Decomposition Guided Disentangled Quantized Half-UNet

SUPERGLASSES: Benchmarking Vision Language Models as Intelligent Agents for AI Smart Glasses

MultiModalPFN: Extending Prior-Data Fitted Networks for Multimodal Tabular Learning