사례 연구

Lifelines와의 데이터 공유를 위한 합성 데이터 생성

클라이언트 정보

Lifelines는 관련 데이터와 생체 시료를 수집하기 위해 2006년부터 167,000명이 넘는 참가자를 대상으로 다세대 코호트 연구를 수행하고 있습니다. 이 데이터는 생활 방식, 건강, 성격, BMI, 혈압, 인지 능력 등과 관련이 있습니다. Lifelines는 이러한 귀중한 데이터를 제공하여 일반적으로 질병 예방, 예측, 진단 및 치료에 중점을 두는 국내 및 국제 연구자, 조직, 정책 입안자 및 기타 이해관계자에게 필수적인 리소스가 됩니다.

상황

바이오뱅크는 연구자, 조직, 정책 입안자 및 기타 이해관계자가 데이터에 더 쉽게 접근할 수 있도록 하는 임무를 수행하고 있으므로 참가자의 개인정보를 보호하기 위한 전략적 솔루션을 마련하는 것이 필수적입니다. 따라서 Lifelines는 Syntho와 협력하여 데이터를 합성함으로써 접근성을 높이고 참가자의 개인 정보를 보호합니다. 실제 데이터를 사용하는 대신 이제 모든 사람이 합성 데이터로 작업할 수 있습니다. 데이터에 관심이 있는 사람이라면 누구나 추가 정보와 지원을 받을 수 있습니다.

해법

새로운 솔루션 채택과 관련하여 Lifelines는 초기 평가 연구를 통해 실제로 합성 데이터와 Syntho를 평가하기를 원했습니다. 여기서는 오픈 소스 솔루션 및 상용 솔루션과 비교하여 정확성, 개인 정보 보호 및 사용 편의성에 대한 Syntho의 합성 데이터를 승인했습니다. 여기서 세트의 경우 지리적 위치와 경도 데이터가 중요합니다. 미리보기로 실제 데이터와 합성 데이터에 대한 참여자의 우편번호 분포를 확인할 수 있으며, 실제 데이터와 합성 데이터의 비교 그래프도 확인할 수 있다. 그래프가 밀접하게 겹치기 때문에 Lifelines에서는 충실도와 정확성이 유지된다는 결론을 내렸습니다. 이는 이 평가의 일부인 하나의 요소일 뿐이므로 요청 시 다른 결과도 제공됩니다.

신토 생명선

연구원, 조직, 정책 입안자 및 기타 이해관계자는 이제 합성 데이터세트를 받을 수 있는 기회를 갖게 되었습니다.

Syntho에서 생성된 합성 데이터에 대한 이러한 성공적인 평가는 Lifelines가 새로운 솔루션을 활용하여 참가자의 개인 정보를 보호하면서 데이터에 더 쉽게 접근할 수 있도록 하는 중요한 진전을 의미합니다. 따라서 Lifelines는 이제 합성 데이터를 활용하여 참가자의 개인 정보를 침해하지 않고 실제 데이터의 통계적 속성을 반영하는 인공 데이터 세트를 만듭니다. 결과적으로, 이 데이터에 관심이 있는 연구자, 조직, 정책 입안자 및 기타 이해관계자는 이제 Syntho와 협력하여 생성된 맞춤형 합성 데이터 세트를 받을 수 있는 기회를 갖게 되었습니다. Lifelines는 합성 데이터를 수용함으로써 데이터에 대한 액세스를 강화하고 연구를 가속화하는 동시에 참가자의 개인 정보 보호를 최고 수준으로 유지합니다. 이는 과학적 발전과 개인 정보 보호에 대한 약속을 강조합니다.

혜택

더 빠른 데이터 액세스

합성 데이터를 사용하면 규정 준수 서류 및 절차를 최소화하여 데이터에 더 빠르게 액세스할 수 있습니다. 이를 통해 데이터 사용자는 규정 준수 절차로 인한 지연 없이 더 빠른 분석, 더 빠른 가설 테스트 및 더 빠른 결과를 얻을 수 있습니다.

참가자의 개인정보를 보호하세요

합성 데이터를 통합함으로써 참가자 정보는 안전하게 유지되어 중요한 세부 정보를 효과적으로 보호합니다. 합성 데이터와 같은 개인 정보 보호 강화 기술은 참가자의 데이터가 보호된다는 확신을 높여 연구 프로젝트에 대한 적극적인 참여를 장려합니다. 이를 통해 이 바이오뱅크에 대한 신뢰가 신뢰할 수 있고 신뢰할 수 있는 리소스로 조성되어 참가자 참여가 더욱 가속화됩니다.

데이터 접근성 향상

합성 데이터는 실제 데이터에 대한 액세스를 선호하지 않거나 최소한의 데이터에 액세스할 수 있는 조직과 정보를 공유할 수 있는 새로운 가능성을 열어줍니다. 이 접근 방식을 사용하면 실제 데이터 공유와 관련된 위험을 완화하면서 데이터 접근성을 높일 수 있습니다.

데이터 카탈로그로 구매하기 전에 데이터 미리보기ue

데이터 상용화를 통해 잠재 구매자는 샌드박스 환경과 같은 곳에서 구매하기 전에 데이터를 미리 보는 것을 선호하는 경우가 많습니다. 그러나 미리보기에 실제 데이터를 사용하는 것은 규정 준수 서류 요구 사항과 사전에 교환할 경우 데이터의 가치가 하락할 위험으로 인해 문제가 됩니다. 합성 데이터 카탈로그를 사용하면 잠재 구매자가 데이터를 편리하게 미리 볼 수 있어 상용화 프로세스가 향상되어 이러한 문제를 극복할 수 있습니다.

조직 : 라이프 라인

위치: 네덜란드

업종 : 헬스 케어

크기 : 100 + 직원

사용 사례 : 통계 분석

대상 데이터: 의료 기록 데이터 

웹 사이트: (요청시)

의료 분야의 합성 데이터 표지

의료 보고서에 합성 데이터를 저장하십시오!