case Study

Syntetisk datagenerering for datadeling med Lifelines

Om klienten

Lifelines, har gjennomført en flergenerasjons kohortstudie siden 2006 med over 167,000 XNUMX deltakere for å samle inn relevante data og bioprøver. Disse dataene er relatert til livsstil, helse, personlighet, BMI, blodtrykk, kognitive evner og mer. Lifelines tilbyr disse verdifulle dataene, noe som gjør dem til en viktig ressurs for nasjonale og internasjonale forskere, organisasjoner, beslutningstakere og andre interessenter som vanligvis fokuserer på å forebygge, forutsi, diagnostisere og behandle sykdommer.

Situasjonen

Siden en biobank har et oppdrag for å gjøre dataene sine mer tilgjengelige for forskere, organisasjoner, beslutningstakere og andre interessenter, er det viktig å ha strategiske løsninger på plass for å ivareta deltakernes personvern. Derfor samarbeider Lifelines med Syntho for å syntetisere dataene, og dermed forbedre tilgjengeligheten og bevare personvernet til deltakerne. Som et alternativ til å bruke ekte data, har alle nå muligheten til å jobbe med syntetiske data. Alle som er interessert i dataene oppfordres til å ta kontakt for ytterligere informasjon og støtte.

løsningen

Når det gjelder å ta i bruk nye løsninger, ønsket Lifelines å evaluere Synthetic Data og Syntho i praksis via en innledende evalueringsstudie. Her godkjente den syntetiske data fra Syntho om nøyaktighet, personvern og brukervennlighet sammenlignet med åpen kildekode-løsninger og kommersielle løsninger. Her, som for settet, er geografisk plassering og longitudinelle data avgjørende. Som en sniktitt kan vi se fordelingen av postnumrene til deltakerne for de virkelige dataene, de syntetiske dataene og en sammenligningsgraf mellom ekte data og syntetiske data. Ettersom grafene overlapper hverandre tett, ble det konkludert av Lifelines at troskap og nøyaktighet er bevart. Siden dette kun er ett element som en del av denne evalueringen, er andre resultater tilgjengelig på forespørsel.

Syntho livliner

Forskere, organisasjoner, beslutningstakere og andre interessenter har nå muligheten til å motta syntetiske datasett

Denne vellykkede evalueringen av syntetiske data generert av Syntho markerer et betydelig skritt fremover for Lifelines i å utnytte nye løsninger for å gjøre dataene deres mer tilgjengelige og samtidig bevare deltakernes personvern. Derfor bruker Lifelines nå syntetiske data for å lage kunstige datasett som gjenspeiler de statistiske egenskapene til ekte data uten å kompromittere deltakernes personvern. Følgelig har forskere, organisasjoner, beslutningstakere og andre interessenter som har en interesse i disse dataene nå muligheten til å motta tilpassede syntetiske datasett, generert i samarbeid med Syntho. Ved å omfavne syntetiske data, øker Lifelines tilgangen til data og akselererer forskningen samtidig som de opprettholder det høyeste nivået av personvern for deltakerne. Dette understreker deres forpliktelse til både vitenskapelig fremgang og bevaring av personvern.

Fordelene

Raskere tilgang til data

Syntetiske data gir raskere tilgang til data ved å minimere samsvarsdokumenter og prosedyrer. Dette gjør det mulig for databrukere for raskere analyse, raskere hypotesetesting og tidligere resultater, uten forsinkelser forårsaket av samsvarsprosedyrer.

Ta vare på deltakernes personvern

Ved å inkludere syntetiske data forblir deltakerinformasjonen sikker, og beskytter deres sensitive detaljer effektivt. Personvernforbedrende teknikker, som syntetiske data, forbedrer deltakernes tillit til at dataene deres er beskyttet, og oppmuntrer deres aktive deltakelse i forskningsprosjekter. Dette fremmer tillit til denne biobanken som en pålitelig og pålitelig ressurs, og akselererer deltakernes engasjement ytterligere.

Økt tilgjengelighet av data

Syntetiske data åpner nye muligheter for å dele informasjon med organisasjoner som kanskje ikke er foretrukket for å få tilgang til ekte data eller som kanskje har tilgang til minimale data. Denne tilnærmingen gir økt datatilgjengelighet samtidig som man reduserer risikoen forbundet med deling av faktiske data.

Forhåndsvis data før du kjøper med en datakatalogue

Med datakommersialisering foretrekker potensielle kjøpere ofte å forhåndsvise dataene før de foretar et kjøp i noe som et sandkassemiljø. Bruk av ekte data for forhåndsvisninger blir imidlertid problematisk på grunn av samsvarskravene til papirarbeid og risikoen for å devaluere dataene hvis de utveksles på forhånd. Man kan overvinne disse utfordringene ved å bruke en syntetisk datakatalog, slik at potensielle kjøpere kan forhåndsvise data på en enkel måte, og dermed forbedre kommersialiseringsprosessen.

Organisasjon: livliner

Sted: Nederland

Bransje: Helsevesen

Størrelse: 100 + ansatte

Bruk tilfelle: Analytics

Måldata: Helsevesenets historiske data 

nettside: På forespørsel

Syntetiske data i helsevesenet

Lagre de syntetiske dataene dine i helserapporten!