Případová studie

Generování syntetických dat pro sdílení dat s Lifelines

O klientovi

Lifelines provádí od roku 2006 vícegenerační kohortovou studii s více než 167,000 XNUMX účastníky, aby shromáždila relevantní data a biologické vzorky. Tyto údaje se týkají životního stylu, zdraví, osobnosti, BMI, krevního tlaku, kognitivních schopností a dalších. Lifelines nabízí tato cenná data, což z nich dělá základní zdroj pro národní a mezinárodní výzkumné pracovníky, organizace, tvůrce politik a další zúčastněné strany, které se obvykle zaměřují na prevenci, předvídání, diagnostiku a léčbu nemocí.

Situace

Vzhledem k tomu, že cílem biobanky je zpřístupnit svá data výzkumným pracovníkům, organizacím, tvůrcům politik a dalším zúčastněným stranám, je nezbytné mít strategická řešení pro ochranu soukromí jejích účastníků. Lifelines proto spolupracuje se společností Syntho, aby syntetizovala data, čímž zlepšila jejich dostupnost a zachovala soukromí účastníků. Jako alternativu k používání reálných dat má nyní každý možnost pracovat se syntetickými daty. Každému, kdo má o data zájem, doporučujeme požádat o další informace a podporu.

řešení

Pokud jde o přijetí nových řešení, společnost Lifelines chtěla zhodnotit Synthetic Data a Syntho v praxi prostřednictvím úvodní hodnotící studie. Zde schválila syntetická data společnosti Syntho o přesnosti, soukromí a snadném použití ve srovnání s řešeními s otevřeným zdrojovým kódem a komerčními řešeními. Zde, jako u souboru, je rozhodující geografická poloha a podélná data. Jako náhled můžeme vidět rozdělení poštovních směrovacích čísel účastníků pro skutečná data, syntetická data a srovnávací graf mezi skutečnými daty a syntetickými daty. Protože se grafy těsně překrývají, společnost Lifelines dospěla k závěru, že věrnost a přesnost jsou zachovány. Protože se jedná pouze o jeden prvek v rámci tohoto hodnocení, další výsledky jsou k dispozici na vyžádání.

Syntho záchranná lana

Výzkumníci, organizace, tvůrci politik a další zúčastněné strany mají nyní příležitost získat syntetické datové soubory

Toto úspěšné vyhodnocení syntetických dat generovaných Syntho znamená pro Lifelines významný krok kupředu při využívání nových řešení, aby byla jejich data dostupnější a zároveň byla zachována soukromí účastníků. Lifelines proto nyní využívá syntetická data k vytváření umělých datových sad, které odrážejí statistické vlastnosti skutečných dat, aniž by došlo k ohrožení soukromí účastníků. V důsledku toho mají nyní výzkumníci, organizace, tvůrci politik a další zúčastněné strany, které mají o tato data zájem, příležitost získat přizpůsobené syntetické datové sady, vytvořené ve spolupráci se společností Syntho. Začleněním syntetických dat zvyšuje Lifelines přístup k datům a urychluje výzkum při zachování nejvyšší úrovně ochrany soukromí svých účastníků. To podtrhuje jejich závazek k vědeckému pokroku a ochraně soukromí.

Výhody

Rychlejší přístup k datům

Syntetická data umožňují rychlejší přístup k datům tím, že minimalizují papírování a postupy pro dodržování předpisů. To umožňuje uživatelům dat rychlejší analýzu, rychlejší testování hypotéz a dřívější výsledky bez prodlev způsobených postupy dodržování předpisů.

Chraňte soukromí účastníků

Začleněním syntetických dat zůstávají informace o účastnících v bezpečí a účinně chrání jejich citlivé údaje. Techniky zvyšující soukromí, jako jsou syntetická data, zvyšují důvěru účastníků, že jejich data jsou chráněna, a podporují jejich aktivní účast na výzkumných projektech. To podporuje důvěru v tuto biobanku jako spolehlivý a důvěryhodný zdroj, což dále urychluje zapojení účastníků.

Zvýšená dostupnost dat

Syntetická data otevírají nové možnosti sdílení informací s organizacemi, které nemusí být preferovány pro přístup ke skutečným datům nebo mohou mít přístup k minimálním datům. Tento přístup umožňuje lepší dostupnost dat a zároveň zmírňuje rizika spojená se sdílením skutečných dat.

Prohlédněte si data před nákupem pomocí katalogu datue

Při komercializaci dat potenciální kupci často dávají přednost náhledu dat před nákupem v prostředí jako je sandbox. Používání skutečných dat pro náhledy se však stává problematickým kvůli požadavkům na dodržování předpisů a riziku znehodnocení dat, pokud jsou předem vyměněny. Tyto problémy by bylo možné překonat použitím katalogu syntetických dat, který by potenciálním kupujícím umožnil pohodlný náhled dat, čímž by se zlepšil proces komercializace.

Organizace: Životní linie

pronájem: Nizozemí

Průmysl: Zdravotní péče

Velikost: 100+ zaměstnanců

Použití: Analýza

Cílová data: Historická data zdravotnictví 

Webové stránky: Na vyžádání

Syntetická data v krytu zdravotnictví

Uložte si syntetická data do zdravotnické zprávy!