Synthetische data voor de Nederlandse Kamer van Koophandel (KVK)

Over de klant
De overheidsorganisatie fungeert als een centrale bron voor bedrijfsgerelateerde informatie in Nederland. Het onderhoudt een bedrijfsgerelateerde database. De organisatie streeft ernaar om haar relevantie voor organisaties te vergroten door relevante ondersteunende diensten te faciliteren om (startende) organisaties te versnellen bij het opbouwen, behouden en verbeteren van hun concurrentiepositie.
De situatie
Data speelt een cruciale rol in deze ambitie door organisaties te faciliteren met relevante ondersteunende diensten, marktonderzoek en inzichten. Om dit datapotentieel te benutten, organiseerde de organisatie een tweedaagse hackathon voor interne collega's om nieuwe initiatieven te ontdekken en te ontwikkelen. Als basis voor deze hackathon zouden interne databronnen waardevol kunnen zijn om te gebruiken om nieuwe datagestuurde initiatieven te openen. Privacybescherming is echter van cruciaal belang en de organisatie moet de toegankelijkheid van bedrijfsinformatie in evenwicht brengen met het beschermen van gevoelige data en het voldoen aan de relevante privacyregelgeving.
De oplossing
Daarom wordt in de context van deze interne hackathon een synthetische versie van de organisatiedata gebruikt om datagestuurde oplossingen te spotten en te bouwen tijdens deze snelle hackathon van twee dagen. Er zijn synthetische data gegenereerd om echte ondernemingsregisterdata na te bootsen en tegelijkertijd de privacy en databescherming te waarborgen. Met deze synthetische dataset kunnen deelnemers aan de hackathon innovatieve oplossingen, algoritmen en applicaties ontwikkelen en testen zonder daadwerkelijk gevoelige bedrijfsinformatie te gebruiken. Daarnaast worden synthetische data gebruikt als testdata in de ontwikkel-, test- en acceptatieomgevingen.
De voordelen
Privacy-by-design hackathon met representatieve en bruikbare data
Data speelt een grote rol in deze hackathon. Datavoorbereiding voor openbare hackathons vergt veel tijd en moeite. Bovendien maakt de anonimisering van data de data minder nauwkeurig en abstracter, wat de prestaties van de datawetenschapsmodellen beïnvloedt. Er wordt gebruik gemaakt van synthetische data om iedere deelnemer in staat te stellen met relevante en representatieve data te werken, zonder daadwerkelijke individuen bloot te leggen.
Innovatieve hackathon-initiatieven op relevante data
Tijdens deze hackathon zijn door de collega's van de organisatie verschillende nieuwe data-initiatieven geïntroduceerd om de relevantie ervan te vergroten. Deze initiatieven zullen worden genomen als startpunt voor de implementatie van de datagedreven strategie om organisaties te versnellen bij het opbouwen, behouden en verbeteren van hun concurrentiepositie.
Snelle toegang tot data
Het aanvragen van datatoegang voor de relevante data die tijdens de hackathon worden gebruikt, zou anders maanden duren. Daarom zorgde deze hackathon voor snelle toegang tot relevante data om het volledige momentum van het bouwen van nieuwe data-initiatieven te benutten.
Ontdek meer casestudies
Bootst (gevoelige) data na met AI om synthetische data-tweelingen te genereren
Red je gids voor synthetische data nu
Wat is synthetische data?
Hoe werkt het?
Waarom gebruiken organisaties het?
Hoe te beginnen?
Schrijf je in op onze nieuwsbrief
Blijf op de hoogte van het laatste nieuws over synthetische data