Fallstudie

Syntetisk datagenerering för datadelning med Lifelines

Om klienten

Lifelines, genomför en multigenerationell kohortstudie sedan 2006 med över 167,000 XNUMX deltagare för att samla in relevant data och bioprover. Dessa data är relaterade till livsstil, hälsa, personlighet, BMI, blodtryck, kognitiva förmågor och mer. Lifelines erbjuder denna värdefulla data, vilket gör den till en viktig resurs för nationella och internationella forskare, organisationer, beslutsfattare och andra intressenter som vanligtvis fokuserar på att förebygga, förutsäga, diagnostisera och behandla sjukdomar.

Situationen

Eftersom en biobank har ett uppdrag att göra sin data mer tillgänglig för forskare, organisationer, beslutsfattare och andra intressenter är det viktigt att ha strategiska lösningar på plats för att skydda deltagarnas integritet. Därför samarbetar Lifelines med Syntho för att syntetisera data, och därigenom förbättra dess tillgänglighet och bevara deltagarnas integritet. Som ett alternativ till att använda riktig data har alla nu möjlighet att arbeta med syntetisk data. Alla som är intresserade av uppgifterna uppmanas att kontakta oss för ytterligare information och stöd.

Lösningen

När det gäller att anta nya lösningar ville Lifelines utvärdera Synthetic Data och Syntho i praktiken via en första utvärderingsstudie. Här godkände den syntetiska data från Syntho om noggrannhet, integritet och användarvänlighet i jämförelse med lösningar med öppen källkod och kommersiella lösningar. Här, vad gäller uppsättningen, är geografisk plats och longitudinella data avgörande. Som en förhandstitt kan vi se fördelningen av postnummer för deltagare för verklig data, syntetisk data och en jämförelsegraf mellan verklig data och syntetisk data. Eftersom graferna överlappar tätt, drog Lifelines slutsatsen att trohet och noggrannhet bevaras. Eftersom detta bara är en del av denna utvärdering, finns andra resultat tillgängliga på begäran.

Syntho livlinor

Forskare, organisationer, beslutsfattare och andra intressenter har nu möjlighet att ta emot syntetiska datamängder

Denna framgångsrika utvärdering av syntetiska data som genererats av Syntho markerar ett viktigt steg framåt för Lifelines i att utnyttja nya lösningar för att göra deras data mer tillgänglig samtidigt som deltagarnas integritet bevaras. Därför använder Lifelines nu syntetiska data för att skapa artificiella datauppsättningar som speglar de statistiska egenskaperna hos verklig data utan att äventyra deltagarnas integritet. Följaktligen har forskare, organisationer, beslutsfattare och andra intressenter som har ett intresse av denna data nu möjlighet att ta emot skräddarsydda syntetiska datauppsättningar, genererade i samarbete med Syntho. Genom att ta till sig syntetisk data ökar Lifelines åtkomsten till data och accelererar forskningen samtidigt som de upprätthåller den högsta nivån av integritetsskydd för sina deltagare. Detta understryker deras engagemang för både vetenskapliga framsteg och skydd av privatlivet.

Fördelarna

Snabbare åtkomst till data

Syntetisk data möjliggör snabbare åtkomst till data genom att minimera efterlevnadspapper och procedurer. Detta möjliggör för dataanvändare snabbare analys, snabbare hypotestestning och tidigare resultat, utan förseningar orsakade av efterlevnadsprocedurer.

Bevara deltagarnas integritet

Genom att införliva syntetiska data förblir deltagarinformationen säker och skyddar deras känsliga detaljer effektivt. Integritetsförbättrande tekniker, som syntetiska data, förbättrar deltagarnas förtroende för att deras data är skyddade, vilket uppmuntrar deras aktiva deltagande i forskningsprojekt. Detta främjar förtroendet för denna biobank som en pålitlig och pålitlig resurs, vilket ytterligare accelererar deltagarnas engagemang.

Ökad tillgänglighet till data

Syntetisk data öppnar nya möjligheter för att dela information med organisationer som kanske inte föredrar att få tillgång till riktig data eller som kanske har tillgång till minimal data. Detta tillvägagångssätt möjliggör ökad datatillgänglighet samtidigt som riskerna i samband med att dela faktiska data minskar.

Förhandsgranska data innan du köper med en datakatalogue

Med datakommersialisering föredrar potentiella köpare ofta att förhandsgranska data innan de gör ett köp i något som en sandlådemiljö. Att använda riktiga data för förhandsgranskningar blir dock problematiskt på grund av krav på efterlevnadspapper och risken för att devalvera data om de utbyts i förväg. Man skulle kunna övervinna dessa utmaningar genom att använda en syntetisk datakatalog, vilket gör det möjligt för potentiella köpare att förhandsgranska data bekvämt, och därigenom förbättra kommersialiseringsprocessen.

Organisation: livlinor

Plats: Nederländerna

Bransch: Healthcare

Storlek: 100 + anställda

Användningsfall: Analytics

Måldata: Sjukvårdshistoriska data 

webbplats: På förfrågan

Syntetisk data inom sjukvården

Spara dina syntetiska data i sjukvårdsrapporten!