Casestudies
Synthetische datageneratie voor het delen van data met Lifelines
Over de klant
Lifelines voert sinds 2006 een multigenerationeel cohortonderzoek uit met meer dan 167,000 deelnemers om relevante data en biomonsters te verzamelen. Deze data hebben betrekking op levensstijl, gezondheid, persoonlijkheid, BMI, bloeddruk, cognitieve vaardigheden en meer. Lifelines biedt deze waardevolle data aan, waardoor het een essentiële hulpbron wordt voor nationale en internationale onderzoekers, organisaties, beleidsmakers en andere belanghebbenden die zich doorgaans richten op het voorkomen, voorspellen, diagnosticeren en behandelen van ziekten.
De situatie
Omdat een biobank een missie heeft om haar data toegankelijker te maken voor onderzoekers, organisaties, beleidsmakers en andere belanghebbenden, is het essentieel dat er strategische oplossingen zijn om de privacy van haar deelnemers te waarborgen. Daarom werkt Lifelines samen met Syntho om de data te synthetiseren, waardoor de toegankelijkheid ervan wordt verbeterd en de privacy van deelnemers wordt behouden. Als alternatief voor het gebruik van echte data heeft iedereen nu de mogelijkheid om met synthetische data te werken. Iedereen die geïnteresseerd is in de data, wordt aangemoedigd contact op te nemen voor meer informatie en ondersteuning.
De oplossing
Wat het adopteren van nieuwe oplossingen betreft, wilde Lifelines Synthetic Data en Syntho via een eerste evaluatieonderzoek in de praktijk evalueren. Hier keurde het synthetische data van Syntho goed over nauwkeurigheid, privacy en gebruiksgemak in vergelijking met open-sourceoplossingen en commerciële oplossingen. Hier zijn, net als voor de set, de geografische locatie en longitudinale data van cruciaal belang. Als sneak preview kunnen we de verdelingen van postcodes van deelnemers zien voor de echte data, de synthetische data en een vergelijkingsgrafiek tussen echte data en synthetische data. Omdat de grafieken elkaar nauw overlappen, werd door Lifelines geconcludeerd dat de betrouwbaarheid en nauwkeurigheid behouden blijven. Omdat dit slechts één onderdeel is van deze evaluatie, zijn andere resultaten op aanvraag beschikbaar.
Onderzoekers, organisaties, beleidsmakers en andere belanghebbenden hebben nu de mogelijkheid om synthetische datasets te ontvangen
Deze succesvolle evaluatie van door Syntho gegenereerde synthetische data betekent een belangrijke stap voorwaarts voor Lifelines bij het benutten van nieuwe oplossingen om hun data toegankelijker te maken en tegelijkertijd de privacy van deelnemers te behouden. Daarom gebruikt Lifelines nu synthetische data om kunstmatige datasets te creëren die de statistische eigenschappen van echte data weerspiegelen zonder de privacy van de deelnemers in gevaar te brengen. Hierdoor hebben onderzoekers, organisaties, beleidsmakers en andere belanghebbenden die belang hebben bij deze data nu de mogelijkheid om op maat gemaakte synthetische datasets te ontvangen, gegenereerd in samenwerking met Syntho. Door synthetische data te omarmen, vergroot Lifelines de toegang tot data en versnelt het onderzoek, terwijl het hoogste niveau van privacybescherming voor hun deelnemers behouden blijft. Dit onderstreept hun inzet voor zowel wetenschappelijke vooruitgang als het behoud van de privacy.
De voordelen
Snellere toegang tot data
Synthetische data zorgen voor snellere toegang tot data door papierwerk en procedures voor naleving te minimaliseren. Hierdoor kunnen datagebruikers snellere analyses, snellere hypothesetests en eerdere resultaten uitvoeren, zonder vertragingen veroorzaakt door nalevingsprocedures.
Bescherm de privacy van deelnemers
Door synthetische data op te nemen, blijft de informatie van deelnemers veilig, waardoor hun gevoelige data effectief worden beschermd. Privacybevorderende technieken, zoals synthetische data, vergroten het vertrouwen van deelnemers dat hun data worden beschermd, wat hun actieve deelname aan onderzoeksprojecten aanmoedigt. Dit bevordert het vertrouwen in deze biobank als een betrouwbare en vertrouwde bron, waardoor de betrokkenheid van deelnemers verder wordt versneld.
Verhoogde toegankelijkheid van data
Synthetische data opent nieuwe mogelijkheden voor het delen van informatie met organisaties die misschien niet de voorkeur geven aan toegang tot echte data of toegang hebben tot minimale data. Deze aanpak zorgt voor een grotere toegankelijkheid van data en beperkt tegelijkertijd de risico's die gepaard gaan met het delen van daadwerkelijke data.
Bekijk een voorbeeld van data voordat u koopt met een datacatalogus
Bij het commercialiseren van data geven potentiële kopers er vaak de voorkeur aan om een voorbeeld van de data te bekijken voordat ze een aankoop doen in bijvoorbeeld een sandbox-omgeving. Het gebruik van echte data voor previews wordt echter problematisch vanwege de papierwerkvereisten en het risico dat de data worden gedevalueerd als ze vooraf worden uitgewisseld. Men zou deze uitdagingen kunnen overwinnen door gebruik te maken van een synthetische datacatalogus, waardoor potentiële kopers gemakkelijk een voorbeeld van de data kunnen bekijken, waardoor het commercialiseringsproces wordt verbeterd.
Organisatie: Lifelines
Locatie: Nederland
Industrie: HealthCare
Afmetingen: 100 + werknemers
Use case: Analytics
Doeldata: Historische data uit de gezondheidszorg
Website: Op aanvraag
Sla uw synthetische data op in zorgrapport!
- Verken de rol van synthetische data in de zorgsector
- Wat zijn synthetische data en waarom gebruiken zorgorganisaties het?
- Waarde toevoegende referentie use cases in de gezondheidszorg (zoals farma, ziekenhuizen, health-tech, etc.)