HeCoFuse: Cross-Modal Complementary V2X Cooperative Perception with Heterogeneous Sensors

HeCoFuse is een geavanceerd V2X-samenwerkingsraamwerk dat door middel van hiërarchische fusie en adaptieve aandachtsmechanismen robuuste 3D-perceptie mogelijk maakt onder heterogene sensorconfiguraties, wat resulteert in state-of-the-art prestaties op de TUMTraf-V2X-dataset en een eerste plaats in de CVPR 2025 DriveX-uitdaging.

Chuheng Wei, Ziye Qin, Walter Zimmer, Guoyuan Wu, Matthew J. Barth

Gepubliceerd 2026-03-24
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

HeCoFuse: De "Super-Oog" voor Slimme Auto's en Verkeerslichten

Stel je voor dat je in een drukke stad rijdt. Je auto heeft camera's en een soort "laser-ogen" (LiDAR) om te zien wat er om je heen gebeurt. Maar wat als je auto alleen maar camera's heeft, terwijl de verkeerslichten aan de kant van de weg alleen maar laser-ogen hebben? Of wat als de ene auto alles heeft, maar de andere niets?

In de echte wereld zijn niet alle auto's en verkeersinfrastructuur hetzelfde. Ze hebben verschillende "zintuigen". Dit maakt het heel moeilijk om samen te werken, omdat ze niet op dezelfde manier kunnen "praten" of kijken.

De onderzoekers van dit papier hebben HeCoFuse bedacht. Dit is een slim systeem dat ervoor zorgt dat auto's en verkeerslichten, ongeacht welke zintuigen ze hebben, perfect samen kunnen werken om gevaar te zien en ongelukken te voorkomen.

Hier is hoe het werkt, vertaald naar alledaagse taal:

1. Het Probleem: Een Taalbarrière tussen Zintuigen

Stel je een gesprek voor tussen een persoon die alleen maar kan zien (camera) en een persoon die alleen maar kan voelen (laser). Als ze samen een object moeten beschrijven, is dat lastig. De één zegt: "Het is rood en glanzend," en de ander zegt: "Het is 5 meter weg en heeft een scherpe hoek."

In de autowereld is dit hetzelfde. Camera's zien kleuren en tekst, maar weten niet precies hoe ver iets weg is. Laser (LiDAR) weet precies hoe ver iets is, maar ziet geen kleuren. Als ze proberen hun informatie te mengen zonder een slim plan, krijg je een rommelige boodschap die niemand begrijpt.

2. De Oplossing: HeCoFuse als de "Super-Vertaler"

HeCoFuse is als een super-slimme tolk die twee dingen doet:

A. De Slimme Vertaler (Hiërarchische Aandacht)
Stel je voor dat je een team hebt om een raadsel op te lossen. Soms heb je iemand nodig die goed kan zien (de camera), en soms iemand die goed kan meten (de laser).
HeCoFuse kijkt continu naar de situatie en vraagt zich af: "Wie heeft het nu het beste antwoord?"

  • Is het donker? Dan luistert het systeem meer naar de laser (die ziet in het donker).
  • Is het een gekleurd bordje? Dan luistert het meer naar de camera.
    Het systeem weegt de informatie van de verschillende auto's en verkeerslichten continu af, zodat ze precies weten wie er het meeste vertrouwen mag hebben.

B. De Slimme Schaal (Aanpasbare Resolutie)
Soms sturen auto's heel veel details door (zoals een 4K-foto), en soms sturen ze maar een ruwe schets. Als je een 4K-foto probeert te vergelijken met een ruwe schets, wordt je computer gek.
HeCoFuse past de "resolutie" aan. Het zorgt ervoor dat alle informatie op hetzelfde niveau wordt gebracht voordat ze worden samengevoegd. Het is alsof je een grote foto en een kleine tekening eerst allebei op dezelfde grootte zet voordat je ze naast elkaar legt. Dit bespaart ook veel rekenkracht, zodat het systeem snel genoeg is voor echt verkeer.

3. Het Grote Experiment: De "Mix & Match" Test

De onderzoekers hebben hun systeem getest met de TUMTraf-V2X dataset. Dit is een echte dataset van verkeer in München. Ze hebben het systeem getraind op negen verschillende scenario's:

  • Auto met alles + Verkeerslicht met alles.
  • Auto met alleen laser + Verkeerslicht met alleen camera.
  • En alles daartussenin.

Het resultaat? Het systeem werkt perfect in alle situaties.

  • Als alles perfect is uitgerust, is het het allerbeste ter wereld (ze wonnen zelfs de eerste prijs in een wereldwijde wedstrijd, de CVPR 2025 DriveX challenge).
  • Maar het echte wonder is: zelfs als een auto alleen maar camera's heeft en de verkeerslicht alleen maar laser, werkt het systeem nog steeds heel goed. Het vult de gaten van de ene auto op met de kennis van de andere.

Waarom is dit belangrijk?

Vroeger dachten onderzoekers: "Alle auto's moeten exact dezelfde dure apparatuur hebben om veilig te zijn."
HeCoFuse zegt: "Nee, dat hoeft niet!"
Dankzij dit systeem kunnen goedkopere auto's (met minder sensoren) veilig samenwerken met dure auto's of slimme verkeerslichten. Het maakt het verkeer veiliger, omdat het systeem altijd de beste informatie gebruikt, ongeacht wie wat heeft.

Kortom: HeCoFuse zorgt ervoor dat elke auto en elk verkeerslicht, of ze nu rijk of arm zijn aan sensoren, één groot, slim team vormen dat alles ziet wat er gebeurt op de weg.

Verdrinkt u in papers in uw vakgebied?

Ontvang dagelijkse digests van de nieuwste papers die bij uw onderzoekswoorden passen — met technische samenvattingen, in uw taal.

Probeer Digest →