Skip to content

Waarom dit specificatie document

Te weinig aandacht voor federatieve oplossingen en het concept van data visiting

Ten tijde van het schrijven van dit document zijn een aantal belangrijke richtlijnen in de maak betreffende de uitwerking en implementatie van de EHDS voor secundair gebruik, met name:

  • TEHDAS2: gedetailleerde richtlijnen en technische specificiaties in 11 documenten.1
  • Data Spaces Support Center Blueprint: industrie-overstijgende richtlijnen voor inrichting van data spaces.
  • Uitgangspunten LDN: brede uitgangspunten geformuleerd door VWS, waaronder privacy-by-design, hoge mate van open source werken en opslag van data bij de bron.

Deze ontwikkelingen geven een steeds duidelijker beeld van hoe een landelijke gezondheidsdata-infrastructuur voor onderzoek, beleid en innovatie eruit zou kunnen c.q. moeten zien. Tegelijkertijd constateren we een lacune ten aanzien van het hanteren van principes als privacy-by-design en data visiting. In de inleiding van de EHDS wordt in overweging 80 gesteld dat:

Gezien de gevoeligheid van gezondheidsgegevens moeten waar mogelijk beginselen als “privacy door ontwerp” en “privacy door standaardinstellingen” en het concept “breng de vragen naar de gegevens in plaats van die gegevens te verplaatsen” in acht worden genomen.

Het concept van data visiting, ook wel bekend als federated computing of Personal Health Train (PHT), wordt nergens in de EHDS nader toegelicht2. TEHDAS2 M7.4 Draft technical, functional and security specifications of Secure Processing Environments (hoofdstuk 6) gaat hier op in en maakt een aanzet voor de definitie van federated computing.

Definities federated computing in TEHDAS2

Gedecentraliseerde berekening van data waarbij de berekeningen op lokale, gedistribueerde BVOs worden uitgevoerd in plaats van centrale verwerking in één BVO. Een dergelijke aanpak wordt aanbevolen in overweging 80 ten behoeve van privacy preserving computation. Gefedereerde berekening maakt het mogelijk om de data dichter bij hun originele locatie te houden waarbij alleen geaggregeerde resultaten of model parameters worden gedeeld, en daarmee privacy en veiligheid verhogen.

Een specifieke vorm van gefedereerde verwerking waarbij statistieken lokaal worden berekend op verschillende, gedistrueerde BVOs. Deze methode is geschikt voor o.a. vergelijkende analyses, multi-centra onderzoek en andere vormen van collaboratieve statistische analyse. Alleen geaggregeerde resultaten of samenvattende statistieken worden uit de lokale BVOs geexporteerd, met bijbehorende waarborgen dat geen persoonsgegevens uit de BVO worden onttrokken.

Een specifieke vorm van gefedereerde berekening waarbij modellen worden getraind en gevalideerd op gedistribueerde BVOs. De ruwe data wordt niet gedeeld tussen de BVOs. In plaats daarvan worden alleen de model updates gedeeld om daarmee betere data privacy en beveiliging te bereiken. Omdat het moeilijk is om de anonimiteit van tussentijdse resultaten te beoordelen, is het essentieel dat gefedereerd leren gebeurd in een vertrouwd netwerk van BVOs.

TEHDAS2 maakt onderscheid tussen twee scenarios, namelijk gefedereerde analyse (a) en gefedereerd leren (b).

Een specificatie van een decentraal netwerk van BVOs

Centrale BVOs, zoals bijvoorbeeld de CBS Microdata omgeving of de Trusted Research Environments zoals in EOSC-ENTRUST verband worden geïmplementeerd, zijn op dit moment de meest gangbare vorm van BVOs. Dit document beschrijft een architectuur van een decentraal netwerk van BVOs3 dat verschillende vormen van federated computing (federated learning en federated analytics) ondersteund als ook gegevens aanlevering naar een centrale TRE (data pooling). Data stations zijn een essentieel onderdeel en fungeren als hoeksteen voor dit decentrale netwerk van BVOs. Wij denken dat een dergelijk decentraal netwerk een belangrijke bijdrage kan leveren aan het effectief, efficiënt èn veilig implementeren van de EHDS en zien deze als een aanvulling op c.q. alternatief voor centrale BVOs.


  1. Deze gedetailleerde functionele en techniscke specificaties van health data spaces c.q. BVOs zijn nog in consultatie-fase en moeten nog door de Europese Commissie vastgesteld. Voor primair gebruik is dit uiterlijk maart 2027, voor secundair gebruik (de scope van TEHDAS2) maart 2029. 

  2. Het woord federated komt slecht twee keer voor in de EHDS verordening. 

  3. In TEHDAS2 wordt dit een federatieve BVO wordt genoemd. Wij gebruiken liever de termen centraal, decentraal en hybride, wat in de inleiding van het Applicatie nader wordt toegelicht. 

Comments