Casestudies

Synthetische data voor het Nationaal Bureau voor de Statistiek, Centraal Bureau voor de Statistiek (CBS)

Over de klant

Als nationaal statistiekbureau levert het CBS betrouwbare statistische informatie en data om inzicht te verkrijgen in maatschappelijke vraagstukken. Zo ondersteunt het het publieke debat, de beleidsontwikkeling en de besluitvorming en draagt ​​het bij aan de welvaart, het welzijn en de democratie.

Het CBS werd in 1899 opgericht als antwoord op de behoefte aan onafhankelijke en betrouwbare informatie die het begrip van maatschappelijke vraagstukken bevordert. Dit is nog steeds de belangrijkste rol van het CBS. Door de tijd heen is het CBS uitgegroeid tot een innovatieve kennisinstelling, met continue adoptie van nieuwe technologieën en ontwikkelingen om de kwaliteit van zijn data en zijn onafhankelijke positie te waarborgen

De situatie

Het CBS beschikt over een aanzienlijke hoeveelheid data waarvan de privacy volledig gewaarborgd moet zijn. Vanuit organisatorisch en operationeel perspectief is er behoefte aan verbeterde methoden voor datauitwisseling als reactie op de steeds strengere privacyregels en de obstakels die deze met zich meebrengen op het gebied van datauitwisseling.

Het CBS levert relevante, onafhankelijke data over een breed scala aan maatschappelijke vraagstukken. Dit vergt een hoge mate van flexibiliteit van het CBS, iets waar de medewerkers dagelijks hard aan werken. Of het nu gaat om klimaatverandering, duurzaamheid, woningbouwopgave of armoede: het CBS speelt in op de behoefte aan transparante en toegankelijke informatie. De beschikbaarheid van data en de rol van privacy zijn van cruciaal belang, omdat het CBS een rolmodel is in de manier waarop het data gebruikt.

De oplossing

Synthetische data kunnen in dit opzicht een sleutelrol spelen. Belangrijk om te weten is dat ook bij deze toepassingen de privacyregelgeving, zoals de AVG, in acht moet worden genomen. Ze geven richtlijnen over de doeleinden waarvoor gevoelige data wel en niet kunnen worden gebruikt. Het CBS ziet meerwaarde in het gebruik van synthetische data om dit te faciliteren. Vanuit organisatorisch en operationeel perspectief is er behoefte aan verbeterde methoden voor datauitwisseling als reactie op de steeds strengere privacyregels en de obstakels die deze met zich meebrengen op het gebied van datauitwisseling. Het CBS ziet meerwaarde in het gebruik van synthetische data om dit te versnellen en te vereenvoudigen.

Het CBS ziet kansen voor synthetische data voor bepaalde use cases en blijft verdere mogelijkheden onderzoeken. Concreet gaat het CBS synthetische data inzetten voor use cases die het minste risico met zich meebrengen. Het gaat om interne CBS-cases waarin synthetische data worden gegenereerd voor test- en ontwikkelingsdoeleinden. Daarnaast zal het CBS een synthetische dataset vrijgeven voor onderwijsdoeleinden, waarbij een hoge mate van privacy geldt. Voor andere potentiële synthetische datadiensten zal het CBS nog meer ervaring moeten opdoen en daarbij relevante partijen moeten betrekken.

De voordelen

Versnel de datauitwisseling met de wetenschappelijke gemeenschap

De vraag naar data en de hoeveelheid beschikbare data blijven groeien, maar data-uitwisseling met de wetenschappelijke gemeenschap vindt nog steeds niet in voldoende mate plaats.

Positioneert zichzelf als datapartner en datahub

Het CBS wil data veilig gebruiken en delen. Synthetische data worden steeds meer gezien als alternatief voor het uitwisselen van privacygevoelige data. Het CBS krijgt regelmatig vragen over synthetische data en beantwoordt deze graag. Als kennisinstituut positioneert het CBS zich als datapartner en dataknooppunt. Met synthetische data kunnen zowel specifieke samenwerkingen als de rol die het CBS speelt in de samenleving worden versterkt.

Synthetische data als testdata

Het CBS ziet waarde in het intern gebruiken van synthetische data voor test- en evaluatiedoeleinden als alternatief voor het gebruik van echte persoonlijke data uit de productie.

Synthetische data voor educatieve doeleinden

Daarnaast zal het CBS een synthetische dataset vrijgeven voor onderwijsdoeleinden, waarbij een hoge mate van privacy geldt. Dit heeft tot doel de kwaliteit van het onderwijs te verbeteren door dit te faciliteren met relevante en representatieve data.

centraal bureau voor de statistiek logo

Organisatie: centraal Bureau voor de Statistiek (CBS)

Locatie: Nederland

Industrie: Publieke sector

MAAT: 2000 + werknemers

Use case: Analyse, testdata

Doeldata: Gegevens gerelateerd aan de Nederlandse bevolking

Website: https://www.cbs.nl/en-gb

groep mensen glimlachen

Gegevens zijn synthetisch, maar ons team is echt!

Neem contact op met Syntho en een van onze experts neemt razendsnel contact met je op om de waarde van synthetische data te onderzoeken!