Rethinking Time Series Domain Generalization via Structure-Stratified Calibration

Each language version is independently generated for its own context, not a direct translation.

Stel je voor dat je een tolk bent die probeert mensen uit verschillende landen met elkaar te laten praten. Je hebt een boek met zinnen uit Amerika, een ander boek uit Japan en nog een uit Brazilië. Je doel is om een algoritme (een slimme computer) te leren dat deze zinnen kan vertalen, ongeacht waar ze vandaan komen.

In de wereld van tijdsreeksen (zoals hartslagmetingen, slaappatronen of bewegingsdata) proberen wetenschappers al jaren dit soort "vertalingen" te maken tussen verschillende datasets. Maar er is een groot probleem: de bestaande methoden gaan er vaak van uit dat alle data op dezelfde manier werkt. Ze proberen alles in één grote, uniforme pot te gieten.

Dit artikel, getiteld "Rethinking Time Series Domain Generalization via Structure-Stratified Calibration", zegt: "Wacht even, dat werkt niet altijd!"

Hier is de uitleg in simpele taal, met een paar creatieve vergelijkingen.

1. Het Probleem: De "Grote Pot" die niet werkt

Stel je voor dat je een groep mensen hebt die allemaal een driehoek tekenen, en een andere groep die allemaal een cirkel tekent.

De oude methoden (zoals Global Alignment) zeggen: "Oké, laten we de driehoeken en de cirkels gewoon op elkaar gaan lijken door ze allemaal een beetje te vervormen."
Het resultaat? Je krijgt een rommelige, rare vorm die noch een driehoek is, noch een cirkel. Niemand begrijpt het meer.

In de echte wereld betekent dit:

Een slaappatroon van iemand in de VS (met een bepaald type EEG-apparaat) heeft een heel ander "patroon" dan die van iemand in Japan (met een ander apparaat).
Als je ze zomaar op elkaar probeert te laten lijken, verwart de computer de signalen. Het is alsof je probeert een driehoek te laten passen in een cirkelvormig gat door hem te duwen. Het werkt niet, en het maakt de computer zelfs dommer (dit noemen ze negative transfer).

2. De Oplossing: De "Stratificatie" (Het Sorteren)

De auteurs van dit paper stellen een nieuwe aanpak voor: SSCF (Structure-Stratified Calibration).

In plaats van alles in één grote pot te gooien, zeggen ze: "Laten we eerst sorteren op basis van de vorm."

Stel je een grote bibliotheek voor waar boeken van over de hele wereld liggen.

De oude manier: Probeer alle boeken in één grote rij te zetten en ze allemaal op dezelfde manier te ordenen.
De nieuwe manier (SSCF):
1. Sorteren (Stratification): Kijk eerst naar de kaft van het boek. Is het een boek over driehoeken of over cirkels? Leg de driehoek-boeken in de ene hoek en de cirkel-boeken in de andere.
2. Kalibreren (Calibration): Pas nu pas de vertaling toe, maar alleen binnen die hoek.
  - In de "driehoek-hoek" maak je de Amerikaanse driehoekjes net iets meer op de Japanse driehoekjes.
  - In de "cirkel-hoek" maak je de Braziliaanse cirkels op elkaar afgestemd.

Je mengt de driehoeken en cirkels nooit met elkaar. Daardoor blijft de betekenis (de structuur) behouden.

3. Hoe werkt dit technisch? (De "Spectrum"-Vergelijking)

In de wetenschap kijken ze niet naar de kaft van het boek, maar naar het frequentiepatroon (het "spectrums").

Elke dataset heeft een eigen "muziekstuk". Sommige hebben veel lage tonen (bass), andere veel hoge tonen.
Het algoritme kijkt eerst naar dit muziekstuk. Als twee datasets hetzelfde muziekstuk hebben (bijvoorbeeld beide veel bass), dan horen ze bij dezelfde "groep" (stratum).
Vervolgens past het algoritme alleen de luidheid (amplitude) van het geluid aan, zodat ze op elkaar lijken, maar het ritme en de toonhoogte (de structuur) blijven precies hetzelfde.

4. Waarom is dit zo slim?

De auteurs hebben dit getest op 19 verschillende datasets (zoals slaapdata, hartslagdata en bewegingsdata).

Resultaat: Hun methode werkt veel beter dan de oude methoden, vooral als ze de computer op nieuwe, onbekende data testen (dit noemen ze "zero-shot").
De les: Je kunt niet alles uniform behandelen. Je moet eerst begrijpen wat er aan de hand is (de structuur), en pas daarna proberen het aan te passen.

Samenvatting in één zin

In plaats van te proberen alle verschillende soorten data op elkaar te laten lijken door ze te vervormen (wat leidt tot verwarring), sorteren ze de data eerst in groepen met hetzelfde patroon en passen ze ze alleen binnen die groepen aan. Het is het verschil tussen proberen appels en sinaasappels op elkaar te laten lijken, en het slimme idee om appels met appels en sinaasappels met sinaasappels te vergelijken.

Dit maakt de AI veel robuuster en betrouwbaarder in de echte wereld, waar elke dataset net even anders is.

Each language version is independently generated for its own context, not a direct translation.

1. Het Probleem: Structurele Heterogeniteit en Negatieve Transfer

Het artikel adresseert een fundamenteel probleem bij het generaliseren van tijdreeksmodellen over verschillende domeinen (bijv. verschillende sensoren, opnameprotocollen of populaties).

Aannames van bestaande methoden: Traditionele domein-generalisatiemethoden (zoals DeepCORAL, MMD, DANN) gaan ervan uit dat steekproeven uit verschillende domeinen in een gedeelde representatieruimte "vergelijkbaar" zijn. Ze passen een globale alignatie toe, waarbij ze proberen de verdelingen van alle samples uniform aan te passen, ongeacht hun onderliggende structuur.
De realiteit: Tijdreeksen worden vaak gegenereerd door latente dynamische systemen. Verschillende datasets kunnen voortkomen uit structureel heterogene families van deze systemen. Dit resulteert in fundamenteel verschillende verdelingen van kenmerken (bijv. verschillende spectrale vormen of energieverdelingen), zelfs als de semantische labels (bijv. "slaapstadium" of "hartslag") hetzelfde zijn.
Het gevolg: Het toepassen van globale alignatie op structureel incompatibele samples leidt tot spuriële correspondenties (verkeerde koppelingen tussen ongelijksoortige data). Dit veroorzaakt negatieve transfer, waarbij het model prestaties verslechtert in plaats van verbetert, omdat het probeert "driehoeken" op "cirkels" af te stemmen.

2. Methodologie: SSCF (Structure-Stratified Calibration Framework)

De auteurs stellen een nieuw raamwerk voor, SSCF, dat het paradigma verschuift van "globale alignatie" naar "comparability-first, calibration-second". De methode bestaat uit de volgende stappen:

A. Spectrale Modellering en Definities

De auteurs definiëren "structuur" als stabiele spectrale patronen in het frequentiedomein (bijv. pieklocaties, dominante energiebanden). Ze nemen aan dat tijdreeksen kunnen worden gemodelleerd als een combinatie van een structureel latent patroon ( $Z(f)$ ) en domeinspecifieke amplitude-effecten ( $g_d(f)$ ).

B. Structurele Stratificatie (Stratification)

In plaats van alle samples direct te aligneren, worden deze eerst opgesplitst in structureel compatibele subsets:

Spectrale Representatie: Voor elke sample wordt een shallow feature map gegenereerd en vervolgens de kanaalspecifieke vermogensspectrale dichtheid (PSD) geschat (via de Welch-methode).
Clustering: Met behulp van K-Means-clustering op deze PSD-representaties worden de source-domein samples opgesplitst in $K$ clusters (strata). Samples binnen een cluster delen vergelijkbare spectrale patronen.

C. Constructie van Referentie-Ankers (Reference Anchors)

Voor elk structureel stratum wordt een Referentie-Anker geconstrueerd:

Dit is een "Mean-Amplitude-Squared" (MAS) template.
De methode berekent eerst de gemiddelde amplitude van de spectra binnen een cluster en kwadrateert dit vervolgens. Dit maakt het anker minder gevoelig voor uitschieters dan het direct middelen van vermogen.
Deze ankers worden offline berekend en vastgezet (frozen) voor het trainen en infereren.

D. Structurele Matching en Intra-stratum Calibratie

Tijdens training en inferentie (ook op het target-domein):

Matching: Voor elke invoersample wordt de PSD berekend en de dichtstbijzijnde structurele anker (stratum) wordt geïdentificeerd op basis van de Euclidische afstand in de gecombineerde kanaal-frequentie ruimte.
Calibratie: Amplitude-calibratie wordt uitsluitend uitgevoerd binnen het匹配的 stratum.
- De fase-informatie van het spectrum wordt behouden.
- De amplitude wordt geschaald om te matchen met het referentie-anker van dat specifieke stratum.
- Dit voorkomt dat incompatibele structuren met elkaar worden gemengd.

3. Belangrijkste Bijdragen

Identificatie van een Toepassingsgrens: De auteurs karakteriseren dat directe globale alignatie onder structurele heterogeniteit (zonder eerst vergelijkbaarheid te beoordelen) inherent problematisch is en leidt tot spuriële correspondenties.
Het SSCF-raamwerk: Ze introduceren een operationeel raamwerk dat eerst structurele stratificatie toepast en vervolgens calibratie binnen deze strata uitvoert. Dit vermindert de risico's van negatieve transfer aanzienlijk.
Uitgebreide Validatie: De methode is getest op 19 publieke datasets (totaal 100.3k samples) over drie taken: Slaapstadiëring, Detectie van hartritmestoornissen (Arrhythmia) en Menselijke Activiteitsherkenning (HAR).

4. Resultaten

De evaluaties zijn uitgevoerd in een Zero-Shot setting (geen toegang tot target-data tijdens training) en een Leave-One-Domain-Out (LODO) protocol.

Slaapstadiëring: SSCF behaalde een gemiddelde Macro-F1-score van 69.37% in LODO, significant hoger dan sterke baselines zoals SleepDG (60.92%), CORAL (59.58%) en IRM (56.46%). Op externe target-domeinen was de verbetering eveneens duidelijk (bijv. 75.12% vs 71.33% voor CORAL).
Arrhythmia Detectie: SSCF verbeterde zowel de gemiddelde prestatie (81.26% vs 73.16% voor de baseline) als de prestaties op de "slechtste" domeinen, wat aangeeft dat het robuuster is tegen extreme domeinverschillen.
Human Activity Recognition (HAR): Ook hier behaalde SSCF de beste resultaten (94.43% vs 91.83% voor IRM).
Ablatie Studies: Vergelijkingen tonen aan dat "Global Anchor Calibration" (één anker voor alles) vaak slechter presteert dan de baseline, terwijl "Dataset-wise Calibration" (per dataset) onstabiel is. Alleen de structurele stratificatie leidt tot consistente winst.
Gevoeligheidsanalyse: De methode werkt goed met grove stratificatie (K=3 of hoger is vaak voldoende) en prestaties dalen sterk als samples worden toegewezen aan een verkeerd (ver weg) stratum, wat de noodzaak van nauwkeurige matching bevestigt.

5. Betekenis en Conclusie

Dit werk biedt een paradigmaverschuiving in domein-generalisatie voor tijdreeksen. Het benadrukt dat structurele consistentie een voorwaarde is voor effectieve alignatie.

Kerninzicht: Het is niet voldoende om alleen de verdeling van representaties te aligneren; men moet eerst begrijpen welke samples structureel vergelijkbaar zijn.
Efficiëntie: De methode is computerefficiënt en vereist geen complexe generatieve modellen of extra target-data.
Toekomst: De auteurs wijzen op de uitdaging van niet-stationaire dynamica (waarbij structuren in de tijd evolueren) als een richting voor toekomstig onderzoek.

Samenvattend bewijst SSCF dat het eerst identificeren van structureel compatibele subsets en vervolgens calibreren binnen deze groepen een betrouwbaardere en effectievere route is dan het forceren van uniforme globale alignatie.