Casestudies

Synthetische datageneratie voor het delen van data met Lifelines

Over de klant

Lifelines voert sinds 2006 een multigenerationeel cohortonderzoek uit met meer dan 167,000 deelnemers om relevante data en biomonsters te verzamelen. Deze data hebben betrekking op levensstijl, gezondheid, persoonlijkheid, BMI, bloeddruk, cognitieve vaardigheden en meer. Lifelines biedt deze waardevolle data aan, waardoor het een essentiële hulpbron wordt voor nationale en internationale onderzoekers, organisaties, beleidsmakers en andere belanghebbenden die zich doorgaans richten op het voorkomen, voorspellen, diagnosticeren en behandelen van ziekten.

De situatie

Omdat een biobank een missie heeft om haar data toegankelijker te maken voor onderzoekers, organisaties, beleidsmakers en andere belanghebbenden, is het essentieel dat er strategische oplossingen zijn om de privacy van haar deelnemers te waarborgen. Daarom werkt Lifelines samen met Syntho om de data te synthetiseren, waardoor de toegankelijkheid ervan wordt verbeterd en de privacy van deelnemers wordt behouden. Als alternatief voor het gebruik van echte data heeft iedereen nu de mogelijkheid om met synthetische data te werken. Iedereen die geïnteresseerd is in de data, wordt aangemoedigd contact op te nemen voor meer informatie en ondersteuning.

De oplossing

Wat het adopteren van nieuwe oplossingen betreft, wilde Lifelines Synthetic Data en Syntho via een eerste evaluatieonderzoek in de praktijk evalueren. Hier keurde het synthetische data van Syntho goed over nauwkeurigheid, privacy en gebruiksgemak in vergelijking met open-sourceoplossingen en commerciële oplossingen. Hier zijn, net als voor de set, de geografische locatie en longitudinale data van cruciaal belang. Als sneak preview kunnen we de verdelingen van postcodes van deelnemers zien voor de echte data, de synthetische data en een vergelijkingsgrafiek tussen echte data en synthetische data. Omdat de grafieken elkaar nauw overlappen, werd door Lifelines geconcludeerd dat de betrouwbaarheid en nauwkeurigheid behouden blijven. Omdat dit slechts één onderdeel is van deze evaluatie, zijn andere resultaten op aanvraag beschikbaar.

Syntho levenslijnen

Onderzoekers, organisaties, beleidsmakers en andere belanghebbenden hebben nu de mogelijkheid om synthetische datasets te ontvangen

Deze succesvolle evaluatie van door Syntho gegenereerde synthetische data betekent een belangrijke stap voorwaarts voor Lifelines bij het benutten van nieuwe oplossingen om hun data toegankelijker te maken en tegelijkertijd de privacy van deelnemers te behouden. Daarom gebruikt Lifelines nu synthetische data om kunstmatige datasets te creëren die de statistische eigenschappen van echte data weerspiegelen zonder de privacy van de deelnemers in gevaar te brengen. Hierdoor hebben onderzoekers, organisaties, beleidsmakers en andere belanghebbenden die belang hebben bij deze data nu de mogelijkheid om op maat gemaakte synthetische datasets te ontvangen, gegenereerd in samenwerking met Syntho. Door synthetische data te omarmen, vergroot Lifelines de toegang tot data en versnelt het onderzoek, terwijl het hoogste niveau van privacybescherming voor hun deelnemers behouden blijft. Dit onderstreept hun inzet voor zowel wetenschappelijke vooruitgang als het behoud van de privacy.

De voordelen

Snellere toegang tot data

Synthetische data zorgen voor snellere toegang tot data door papierwerk en procedures voor naleving te minimaliseren. Hierdoor kunnen datagebruikers snellere analyses, snellere hypothesetests en eerdere resultaten uitvoeren, zonder vertragingen veroorzaakt door nalevingsprocedures.

Bescherm de privacy van deelnemers

Door synthetische data op te nemen, blijft de informatie van deelnemers veilig, waardoor hun gevoelige data effectief worden beschermd. Privacybevorderende technieken, zoals synthetische data, vergroten het vertrouwen van deelnemers dat hun data worden beschermd, wat hun actieve deelname aan onderzoeksprojecten aanmoedigt. Dit bevordert het vertrouwen in deze biobank als een betrouwbare en vertrouwde bron, waardoor de betrokkenheid van deelnemers verder wordt versneld.

Verhoogde toegankelijkheid van data

Synthetische data openen nieuwe mogelijkheden voor het delen van informatie met organisaties die misschien niet de voorkeur hebben voor toegang tot echte data of toegang hebben tot minimale data. Deze aanpak zorgt voor een grotere toegankelijkheid van data en vermindert tegelijkertijd de risico's die gepaard gaan met het delen van daadwerkelijke data.

Bekijk een voorbeeld van data voordat u koopt met een datacatalogusue

Met datacommercialisering geven potentiële kopers er vaak de voorkeur aan om een ​​voorbeeld van de data te bekijken voordat ze een aankoop doen in zoiets als een sandbox-omgeving. Het gebruik van echte data voor previews wordt echter problematisch vanwege de papierwerkvereisten en het risico van devaluatie van de data als ze van tevoren worden uitgewisseld. Men zou deze uitdagingen kunnen overwinnen door een synthetische datacatalogus te gebruiken, waardoor potentiële kopers gemakkelijk een voorbeeld van data kunnen bekijken, waardoor het commercialiseringsproces wordt verbeterd.

Organisatie: Lifelines

Locatie: Nederland

Industrie: HealthCare

MAAT: 100 + werknemers

Use case: Analytics

Doeldata: Historische data uit de gezondheidszorg 

Website: Op aanvraag

Cover Synthetische data in de gezondheidszorg

Sla uw synthetische data op in zorgrapport!