Case Study

Syntetisk datagenerering til datadeling med Lifelines

Om klienten

Lifelines, har siden 2006 gennemført et kohortestudie med flere generationer med over 167,000 deltagere for at indsamle relevante data og bioprøver. Disse data er relateret til livsstil, sundhed, personlighed, BMI, blodtryk, kognitive evner og mere. Lifelines tilbyder disse værdifulde data, hvilket gør dem til en vigtig ressource for nationale og internationale forskere, organisationer, politiske beslutningstagere og andre interessenter, der typisk fokuserer på at forebygge, forudsige, diagnosticere og behandle sygdomme.

Situationen

Da en biobank har en mission om at gøre dens data mere tilgængelige for forskere, organisationer, politiske beslutningstagere og andre interessenter, er det vigtigt at have strategiske løsninger på plads for at beskytte dens deltageres privatliv. Derfor samarbejder Lifelines med Syntho for at syntetisere dataene og derved forbedre deres tilgængelighed og bevare deltagernes privatliv. Som et alternativ til at bruge rigtige data har alle nu mulighed for at arbejde med syntetiske data. Enhver, der er interesseret i dataene, opfordres til at kontakte os for yderligere information og støtte.

løsningen

Med hensyn til at tage nye løsninger i brug, ønskede Lifelines at evaluere Synthetic Data og Syntho i praksis via en indledende evalueringsundersøgelse. Her godkendte den syntetiske data fra Syntho om nøjagtighed, privatliv og brugervenlighed i forhold til open source-løsninger og kommercielle løsninger. Her, hvad angår sættet, er geografisk placering og længdedata afgørende. Som et sneak preview kan vi se fordelingen af ​​deltagernes postnumre for de rigtige data, de syntetiske data og en sammenligningsgraf mellem rigtige data og syntetiske data. Da graferne overlapper hinanden tæt, blev det konkluderet af Lifelines, at troskab og nøjagtighed er bevaret. Da dette kun er et element som en del af denne evaluering, er andre resultater tilgængelige på anmodning.

Syntho livliner

Forskere, organisationer, politiske beslutningstagere og andre interessenter har nu mulighed for at modtage syntetiske datasæt

Denne succesfulde evaluering af syntetiske data genereret af Syntho markerer et væsentligt skridt fremad for Lifelines i at udnytte nye løsninger til at gøre deres data mere tilgængelige og samtidig bevare deltagernes privatliv. Derfor bruger Lifelines nu syntetiske data til at skabe kunstige datasæt, der afspejler de statistiske egenskaber af rigtige data uden at kompromittere deltagernes privatliv. Derfor har forskere, organisationer, politiske beslutningstagere og andre interessenter, der har en interesse i disse data, nu mulighed for at modtage skræddersyede syntetiske datasæt, genereret i samarbejde med Syntho. Ved at omfavne syntetiske data øger Lifelines adgangen til data og accelererer forskningen, mens de opretholder det højeste niveau af privatlivsbeskyttelse for deres deltagere. Dette understreger deres engagement i både videnskabelige fremskridt og beskyttelse af privatlivets fred.

Fordelene

Hurtigere adgang til data

Syntetiske data giver mulighed for hurtigere adgang til data ved at minimere overholdelse af papirarbejde og procedurer. Dette giver databrugere mulighed for hurtigere analyse, hurtigere hypotesetestning og tidligere resultater uden forsinkelser forårsaget af overholdelsesprocedurer.

Bevar deltagernes privatliv

Ved at inkorporere syntetiske data forbliver deltagerinformationen sikker og beskytter deres følsomme detaljer effektivt. Privatlivsforbedrende teknikker, såsom syntetiske data, forbedrer deltagernes tillid til, at deres data er beskyttet, og opmuntrer til deres aktive deltagelse i forskningsprojekter. Dette fremmer tilliden til denne biobank som en pålidelig og pålidelig ressource, hvilket yderligere accelererer deltagernes engagement.

Øget tilgængelighed af data

Syntetiske data åbner nye muligheder for at dele information med organisationer, der måske ikke foretrækkes at få adgang til rigtige data eller måske har adgang til minimale data. Denne tilgang giver mulighed for øget datatilgængelighed og mindsker samtidig risici forbundet med deling af faktiske data.

Se forhåndsvisning af data før køb med et datakatalogue

Med datakommercialisering foretrækker potentielle købere ofte at forhåndsvise dataene, før de foretager et køb i noget som et sandkassemiljø. Det bliver dog problematisk at bruge rigtige data til forhåndsvisninger på grund af overholdelseskrav til papirarbejde og risikoen for at devaluere dataene, hvis de udveksles på forhånd. Man kunne overvinde disse udfordringer ved at anvende et syntetisk datakatalog, der giver potentielle købere mulighed for at forhåndsvise data bekvemt og derved forbedre kommercialiseringsprocessen.

Organisation: livliner

Beliggenhed: Nederlandene

Branche: HealthCare

Størrelse: 100 + medarbejdere

Brug tilfælde: Analyse

Måldata: Healthcare historiske data 

Internet side: På forespørgsel

Syntetiske data i sundhedsvæsenet

Gem dine syntetiske data i sundhedsrapporten!