ProxyFL: A Proxy-Guided Framework for Federated Semi-Supervised Learning

Dit paper introduceert ProxyFL, een proxy-geleid raamwerk voor Federatief Semi-Gezuperviseerd Leren dat gelijktijdig externe en interne data-heterogeniteit aanpakt door leerbare classifier-weights te gebruiken als proxy's om zowel de globale distributie te optimaliseren als verwerpde ongelabelde samples opnieuw op te nemen in het trainingsproces.

Duowen Chen, Yan Wang

Gepubliceerd 2026-02-25
📖 4 min leestijd☕ Koffiepauze-leesvoer

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat er een groep vrienden is die samen een heel slimme kunstenaar willen worden. Maar er is een probleem: ze mogen hun eigen schetsboeken niet delen, omdat die privé zijn. Ze moeten dus samenwerken zonder hun tekeningen te tonen. Dit is wat Federated Learning (Federatief Leren) doet: computers werken samen om een slim model te maken zonder hun data te delen.

Nu komt het nog lastigere deel: Semi-Supervised Learning. Stel je voor dat elke vriend maar een paar getekende plaatjes heeft met de naam eronder (bijv. "dit is een hond"), maar ze hebben duizenden plaatjes zonder naam. Ze moeten die naamloze plaatjes ook gebruiken om te leren, maar ze weten niet zeker of het een hond of een kat is.

De uitdaging in dit paper, genaamd ProxyFL, is dat deze vrienden allemaal heel verschillend zijn:

  1. Extern verschil: De ene vriend tekent alleen honden, de andere alleen katten. Als ze hun kennis samenvoegen, raakt de groep in de war.
  2. Intern verschil: Bij één vriend zijn de getekende honden heel duidelijk, maar de naamloze plaatjes zijn vaag. Als ze die vaag plaatjes gebruiken, maken ze misschien fouten.

Het oude probleem: "Het gemiddelde is niet goed"

Vroeger deden ze dit zo: ze stuurden hun kennis naar een centrale meester (de server), die alles gemiddeld nam.

  • Het probleem: Als één vriend heel veel rare, verkeerde plaatjes heeft (uitbijters), verpest die persoon het gemiddelde voor iedereen. Het is alsof je de lengte van een groep mensen meet, maar één persoon is een reus; dan denk je dat de hele groep reuzen is.
  • Het andere probleem: Om fouten te voorkomen, gooien ze de twijfelachtige plaatjes weg. Maar zo missen ze waardevolle informatie!

De nieuwe oplossing: ProxyFL (De "Virtuele Vrienden")

De auteurs van dit paper, Duowen Chen en Yan Wang, hebben een slimme truc bedacht. In plaats van alleen te kijken naar de getekende plaatjes, kijken ze naar de mentale lijstjes die de vrienden in hun hoofd hebben.

Stel je voor dat elke vriend een lijstje heeft met "ideale voorbeelden" van elke dierensoort. In de wereld van AI noemen we deze lijstjes Proxies (tussenpersonen).

Hier is hoe ProxyFL werkt, in drie simpele stappen:

1. De Meester maakt een "Perfecte Lijstje" (Global Proxy Tuning)

In plaats van de hele tekeningen van de vrienden te middelen (wat foutgevoelig is), vraagt de meester aan iedereen: "Wat is jullie ideale voorbeeld van een hond?"

  • De vrienden sturen alleen hun lijstje (een paar getallen) naar de meester.
  • De meester kijkt naar al deze lijstjes en maakt een perfect, centraal lijstje dat niet beïnvloed wordt door de rare, eenzame vrienden.
  • Dit lijstje wordt teruggestuurd. Nu heeft iedereen een beter idee van hoe een "wereldwijde hond" eruit moet zien, zonder dat iemand zijn privé-tekeningen heeft laten zien.

2. De "Twijfelende" Plaatjes krijgen een Nieuwe Kans (Indecisive-Categories)

Wat doen ze met die naamloze plaatjes waar niemand zeker van is?

  • Oude manier: "Ik weet het niet zeker, dus ik gooi het weg." (Veel data gaat verloren).
  • ProxyFL manier: "Oké, je weet niet zeker of het een hond of een kat is? Dan doen we het alsof het beide kan zijn!"
  • Ze maken een twijfel-lijstje (de indecisive-categories set). In plaats van te zeggen "Dit is een hond", zeggen ze "Dit is waarschijnlijk een hond OF een kat".
  • Dit voorkomt dat het model fouten maakt door te hard te geloven in een verkeerd antwoord, maar laat het plaatje wel meedoen aan de training. Het is alsof je zegt: "Laten we deze twijfelende tekening gebruiken om te oefenen op het verschil tussen honden en katten, zonder te zeggen welke het precies is."

3. De "Positieve en Negatieve" Spelregels

Om te zorgen dat iedereen goed leert, gebruiken ze een slimme spelregel:

  • Als een plaatje lijkt op het "ideale hond-lijstje", trekken we het dichter naar de hond.
  • Als het lijkt op het "ideale kat-lijstje", duwen we het weg van de hond.
  • Dit gebeurt zelfs met de twijfelachtige plaatjes, maar dan met een beetje meer voorzichtigheid.

Waarom is dit zo cool?

  • Privacy: Ze delen geen foto's, alleen de "mentale lijstjes". Niemand ziet wat je tekent.
  • Snelheid: Omdat ze geen plaatjes weggooien, leren ze sneller.
  • Robuustheid: Het systeem werkt goed, zelfs als sommige vrienden heel rare plaatjes hebben. Het "perfecte lijstje" van de meester corrigeert de fouten.

Kortom: ProxyFL is als een slimme coach die niet kijkt naar wie de meeste fouten maakt, maar die een "ideaal voorbeeld" creëert voor iedereen. En als een speler twijfelt over een regel, geeft de coach niet op, maar zegt: "Oké, het kan A of B zijn, laten we dat samen oefenen." Zo leren ze allemaal sneller en beter, zonder hun geheimen te delen.

Ontvang papers zoals deze in je inbox

Gepersonaliseerde dagelijkse of wekelijkse digests op basis van jouw interesses. Gists of technische samenvattingen, in jouw taal.

Probeer Digest →