Syntho 引擎支持的数据

Syntho 支持哪些类型的数据?

Syntho 支持任何形式的表格数据

合成器 支持任何形式的表格数据,也支持复杂的数据类型。 表格数据是一种按行和列组织的结构化数据,通常采用表格形式。 大多数时候,您会在数据库、电子表格和其他数据管理系统中看到此类数据。

复杂数据支持

复杂数据支持

Syntho 支持大型多表数据集和数据库

Syntho 支持大型多表数据集和数据库。 同样对于多表数据集和数据库,我们最大限度地提高了每个合成数据生成作业的数据准确性,并通过我们的数据质量报告证明了这一点。 此外,SAS 数据专家从外部角度评估并批准了我们的合成数据。

我们优化了我们的平台以最大限度地减少计算要求(例如不需要 GPU),同时不影响数据准确性。 此外,我们支持自动缩放,这样就可以合成一个庞大的数据库。

专门针对多表数据集和数据库,我们自动检测数据类型、模式和格式,以最大限度地提高数据准确性。 对于多表数据库,我们支持表关系自动推断和综合 保持参照完整性. 最后,我们支持 全面的表和列操作 这样您就可以配置合成数据生成作业,也适用于多表数据集和数据库。

保留参照完整性

Syntho 支持自动表关系推断和综合。 我们自动推断并生成反映您的源表的主键和外键,并保护整个数据库和不同系统之间的关系,以保持参照完整性。 外键关系会自动从您的数据库中捕获以保持参照完整性。 或者,可以运行扫描以扫描潜在的外键关系(当外键未在数据库中定义,但例如在应用程序层中定义时)或者可以手动添加它们。

全面的表和列操作

根据您的喜好合成、复制或排除表或列。 当您合成具有多个表的数据库时,人们通常希望能够配置合成数据生成作业以包含和/或排除所需的表组合。

表格模式:

  • Synthesize:使用AI合成表格
  • 复制:复制表格 原样 到目标数据库
  • exclude:从目标数据库中排除该表
多表数据集

复杂数据支持

Syntho 支持包含时间序列数据的合成数据

Syntho 还支持时间序列数据。 时间序列数据是一种按时间顺序收集和组织的数据,每个数据点代表一个特定的时间点。 这种类型的数据通常用于许多部门。 例如,这可能是在金融领域(例如与客户进行交易)或医疗保健领域(患者接受手术),以及许多其他需要了解随时间变化的趋势和模式的领域。

可以定期或不定期地收集时间序列数据。 数据可以是单变量的,由单个变量组成,例如温度,也可以是多变量的,由随时间测量的多个变量组成,例如股票投资组合的价值或公司的收入和支出。

分析时间序列数据通常涉及识别模式、趋势和随时间的季节性波动,以及根据过去的数据预测未来值。 从分析时间序列数据中获得的见解可用于广泛的应用,例如预测销售、预测天气或检测网络异常。 因此,在合成数据时往往需要支持时序数据。

支持的时间序列数据类型

自相关包含在我们的质量保证报告中

支持的数据

Syntho 支持任何形式的表格数据

数据类型 产品描述 例如:
整数 没有任何小数位的整数,可以是正数也可以是负数 42
浮动 具有有限或无限小数位的小数,可以是正数也可以是负数 3,14
布尔 二进制值 真或假,是或否等。
表示文本、类别或其他数据的一系列字符,例如字母、数字、符号或空格 “你好,世界!”
日期/时间 表示特定时间点的值,可以是日期、时间或两者(支持任何数据/时间格式) 2023-02-18 13:45:00
摆件 可以包含多个值和属性的复杂数据类型,也称为字典、映射或哈希表 { "name": "John", "age": 30, "address": "123 Main St." }
排列 相同类型值的有序集合,也称为列表或向量 [1、2、3、4、5]
表示不存在任何数据的特殊值,通常用于指示缺失值或未知值
字符 单个字符,例如字母、数字或符号 '一个'
任何其他 支持任何其他形式的表格数据

用户文档

索取 Syntho 的用户文档!