Casestudies

Synthetische data voor de Nederlandse Kamer van Koophandel (KVK)

Over de klant

De overheidsorganisatie fungeert als centrale bron voor bedrijfsgerelateerde informatie in Nederland. Het onderhoudt bedrijfsgerelateerde data. De organisatie wil haar relevantie voor organisaties vergroten door het faciliteren van relevante ondersteunende diensten om (startende) organisaties te versnellen in het opbouwen, behouden en verbeteren van hun concurrentiepositie.

De situatie

Data speelt een cruciale rol in deze ambitie door organisaties te faciliteren met relevante ondersteunende diensten, marktonderzoek en inzichten. Om dit datapotentieel te benutten, organiseerde de organisatie een tweedaagse hackathon voor interne collega's om nieuwe initiatieven te ontdekken en te ontwikkelen. Als basis voor deze hackathon zouden interne databronnen waardevol kunnen zijn om te gebruiken om nieuwe datagestuurde initiatieven te openen. Privacybescherming is echter van cruciaal belang en de organisatie moet de toegankelijkheid van bedrijfsinformatie in evenwicht brengen met het beschermen van gevoelige data en het voldoen aan de relevante privacyregelgeving.

De oplossing

Daarom wordt in de context van deze interne hackathon een synthetische versie van de organisatiedata gebruikt om datagestuurde oplossingen te spotten en te bouwen tijdens deze snelle hackathon van twee dagen. Er zijn synthetische data gegenereerd om echte ondernemingsregisterdata na te bootsen en tegelijkertijd de privacy en databescherming te waarborgen. Met deze synthetische dataset kunnen deelnemers aan de hackathon innovatieve oplossingen, algoritmen en applicaties ontwikkelen en testen zonder daadwerkelijk gevoelige bedrijfsinformatie te gebruiken. Daarnaast worden synthetische data gebruikt als testdata in de ontwikkel-, test- en acceptatieomgevingen.

De voordelen

Privacy-by-design hackathon met representatieve en bruikbare data

Data speelt een grote rol in deze hackathon. Datavoorbereiding voor openbare hackathons vergt veel tijd en moeite. Bovendien maakt de anonimisering van data de data minder nauwkeurig en abstracter, wat de prestaties van de datawetenschapsmodellen beïnvloedt. Er wordt gebruik gemaakt van synthetische data om iedere deelnemer in staat te stellen met relevante en representatieve data te werken, zonder daadwerkelijke individuen bloot te leggen.

Innovatieve hackathon-initiatieven op relevante data

Tijdens deze hackathon zijn door de collega's van de organisatie verschillende nieuwe data-initiatieven geïntroduceerd om de relevantie ervan te vergroten. Deze initiatieven zullen worden genomen als startpunt voor de implementatie van de datagedreven strategie om organisaties te versnellen bij het opbouwen, behouden en verbeteren van hun concurrentiepositie.

Snelle toegang tot data

Het aanvragen van datatoegang voor de relevante data die tijdens de hackathon worden gebruikt, zou anders maanden duren. Daarom zorgde deze hackathon voor snelle toegang tot relevante data om het volledige momentum van het bouwen van nieuwe data-initiatieven te benutten.

KVK

Organisatie: Nederlandse overheidsorganisatie

Locatie: Nederland

Industrie: regerings- 

MAAT: 1500 + werknemers

Use case: Analyse, testdata

Doeldata: Gegevens uit het ondernemingsregister

Website: op verzoek

groep mensen glimlachen

Gegevens zijn synthetisch, maar ons team is echt!

Neem contact op met Syntho en een van onze experts neemt razendsnel contact met je op om de waarde van synthetische data te onderzoeken!