Syntho 支持任何形式的表格数据
合成器 支持任何形式的表格数据,也支持复杂的数据类型。 表格数据是一种按行和列组织的结构化数据,通常采用表格形式。 大多数时候,您会在数据库、电子表格和其他数据管理系统中看到此类数据。
复杂数据支持
- 时间序列数据
- 大型多表数据集和数据库
- 任何语言(荷兰语、英语等)
- 任何字母表(英文、中文、日文等)
- 地理位置数据(如 GPS)
复杂数据支持
Syntho 支持大型多表数据集和数据库
Syntho 支持大型多表数据集和数据库。 同样对于多表数据集和数据库,我们最大限度地提高了每个合成数据生成作业的数据准确性,并通过我们的数据质量报告证明了这一点。 此外,SAS 数据专家从外部角度评估并批准了我们的合成数据。
我们优化了我们的平台以最大限度地减少计算要求(例如不需要 GPU),同时不影响数据准确性。 此外,我们支持自动缩放,这样就可以合成一个庞大的数据库。
专门针对多表数据集和数据库,我们自动检测数据类型、模式和格式,以最大限度地提高数据准确性。 对于多表数据库,我们支持表关系自动推断和综合 保持参照完整性. 最后,我们支持 全面的表和列操作 这样您就可以配置合成数据生成作业,也适用于多表数据集和数据库。
保留参照完整性
Syntho 支持自动表关系推断和综合。 我们自动推断并生成反映您的源表的主键和外键,并保护整个数据库和不同系统之间的关系,以保持参照完整性。 外键关系会自动从您的数据库中捕获以保持参照完整性。 或者,可以运行扫描以扫描潜在的外键关系(当外键未在数据库中定义,但例如在应用程序层中定义时)或者可以手动添加它们。
全面的表和列操作
根据您的喜好合成、复制或排除表或列。 当您合成具有多个表的数据库时,人们通常希望能够配置合成数据生成作业以包含和/或排除所需的表组合。
表格模式:
- Synthesize:使用AI合成表格
- 复制:复制表格 原样 到目标数据库
- exclude:从目标数据库中排除该表
复杂数据支持
Syntho 支持包含时间序列数据的合成数据
Syntho 还支持时间序列数据。 时间序列数据是一种按时间顺序收集和组织的数据,每个数据点代表一个特定的时间点。 这种类型的数据通常用于许多部门。 例如,这可能是在金融领域(例如与客户进行交易)或医疗保健领域(患者接受手术),以及许多其他需要了解随时间变化的趋势和模式的领域。
可以定期或不定期地收集时间序列数据。 数据可以是单变量的,由单个变量组成,例如温度,也可以是多变量的,由随时间测量的多个变量组成,例如股票投资组合的价值或公司的收入和支出。
分析时间序列数据通常涉及识别模式、趋势和随时间的季节性波动,以及根据过去的数据预测未来值。 从分析时间序列数据中获得的见解可用于广泛的应用,例如预测销售、预测天气或检测网络异常。 因此,在合成数据时往往需要支持时序数据。
支持的时间序列数据类型
- 等间隔时间序列
- 不等间隔时间序列
- 等长时间序列
- 不等长的时间序列
- 缺少观测值的时间序列
- 巨大的时间序列字符串
自相关包含在我们的质量保证报告中
支持的数据
Syntho 支持任何形式的表格数据
数据类型 | 产品描述 | 例如: |
---|---|---|
整数 | 没有任何小数位的整数,可以是正数也可以是负数 | 42 |
浮动 | 具有有限或无限小数位的小数,可以是正数也可以是负数 | 3,14 |
布尔 | 二进制值 | 真或假,是或否等。 |
串 | 表示文本、类别或其他数据的一系列字符,例如字母、数字、符号或空格 | “你好,世界!” |
日期/时间 | 表示特定时间点的值,可以是日期、时间或两者(支持任何数据/时间格式) | 2023-02-18 13:45:00 |
摆件 | 可以包含多个值和属性的复杂数据类型,也称为字典、映射或哈希表 | { "name": "John", "age": 30, "address": "123 Main St." } |
排列 | 相同类型值的有序集合,也称为列表或向量 | [1、2、3、4、5] |
空 | 表示不存在任何数据的特殊值,通常用于指示缺失值或未知值 | 空 |
字符 | 单个字符,例如字母、数字或符号 | '一个' |
任何其他 | 支持任何其他形式的表格数据 |