실제 데이터를 모방하거나 특정 시나리오를 시뮬레이션하는 것을 목표로 사전 정의된 규칙 및 제약 조건을 기반으로 합성 데이터를 생성합니다.
규칙 기반 생성 합성 데이터란 미리 정의된 (비즈니스) 규칙 및 제약 조건을 따르는 인공 또는 시뮬레이션 합성 데이터를 생성하는 프로세스를 말합니다. 이 접근 방식에는 합성 데이터를 생성하기 위한 특정 지침, 조건 및 관계를 정의하는 작업이 포함됩니다. 조직이 규칙 기반 합성 데이터를 사용하는 이유:
데이터가 제한되어 있거나 데이터가 전혀 없는 경우 새로운 기능을 개발할 때 대표 데이터의 필요성이 중요해집니다. 규칙 기반 합성 데이터를 사용하면 처음부터 데이터를 생성하여 테스터와 개발자에게 필수 테스트 데이터를 제공할 수 있습니다.
규칙 기반 합성 데이터는 확장된 행 및/또는 열을 생성하여 데이터를 강화할 수 있습니다. 더 큰 데이터 세트를 쉽고 효율적으로 생성하기 위해 추가 행을 생성하는 데 사용할 수 있습니다. 또한 규칙 기반 합성 데이터를 사용하여 데이터를 확장하고 잠재적으로 기존 열에 종속되는 추가 새 열을 생성할 수 있습니다.
규칙 기반 접근 방식은 다양한 데이터 형식과 구조에 적응할 수 있는 유연성과 사용자 정의를 제공하여 특정 요구 사항에 따라 합성 데이터를 완벽하게 조정할 수 있습니다. 다양한 시나리오를 시뮬레이션하는 규칙을 설계하여 데이터 생성을 위한 유연한 방법을 만들 수 있습니다.
규칙 기반 합성 데이터는 사전 정의된 규칙을 준수하는 데이터를 생성하고, 불일치를 수정하고, 누락된 값을 채우고, 오류를 제거하여 데이터 정리를 용이하게 하며 데이터세트의 무결성과 품질이 보존되도록 보장합니다. 이를 통해 사용자는 훨씬 더 높은 품질의 데이터를 얻을 수 있습니다.
규칙 기반 합성 데이터 생성은 개인 정보 보호 문제나 법적 제한으로 인해 실제 개인 데이터를 사용할 수 없는 시나리오에서 특히 유용합니다. 대안으로 합성 데이터를 생성함으로써 조직은 민감한 정보를 손상시키지 않고 테스트하고 개발할 수 있습니다.
우리 플랫폼은 계산된 열 기능을 통해 규칙 기반 합성 데이터 생성을 지원합니다. 계산된 열 함수를 사용하면 간단한 산술부터 복잡한 논리 및 통계 계산까지 데이터 및 기타 열에 대한 광범위한 작업을 수행할 수 있습니다. 숫자를 반올림하거나, 날짜 일부를 추출하거나, 평균을 계산하거나, 텍스트를 변환하는 경우 이러한 기능은 필요한 데이터를 정확히 생성할 수 있는 다양성을 제공합니다.
다음은 계산된 열 기능을 사용하여 규칙 기반 합성 데이터를 생성하는 몇 가지 일반적인 예입니다.