Los datos compatibles con Syntho Engine

¿Qué tipos de datos admite Syntho?

Syntho admite cualquier forma de datos tabulares

sintetizador admite cualquier forma de datos tabulares y también admite tipos de datos complejos. Los datos tabulares son un tipo de datos estructurados que se organizan en filas y columnas, normalmente en forma de tabla. La mayoría de las veces, ve este tipo de datos en bases de datos, hojas de cálculo y otros sistemas de gestión de datos.

Soporte de datos complejos

Soporte de datos complejos

Syntho admite grandes conjuntos de datos y bases de datos de varias tablas

Syntho admite grandes conjuntos de datos y bases de datos de varias tablas. También para conjuntos de datos y bases de datos de varias tablas, maximizamos la precisión de los datos para cada trabajo de generación de datos sintéticos y lo demostramos a través de nuestro informe de calidad de datos. Además, los expertos en datos de SAS evaluaron y aprobaron nuestros datos sintéticos desde un punto de vista externo.

Optimizamos nuestra plataforma para minimizar los requisitos computacionales (por ejemplo, no se requiere GPU), sin comprometer la precisión de los datos. Además, admitimos el escalado automático, de modo que se puedan sintetizar enormes bases de datos.

Específicamente para conjuntos de datos y bases de datos de varias tablas, detectamos automáticamente los tipos de datos, esquemas y formatos para maximizar la precisión de los datos. Para bases de datos de tablas múltiples, admitimos la inferencia y síntesis automáticas de relaciones de tablas para preservar la integridad referencial. Finalmente, apoyamos a operaciones completas de tablas y columnas para que pueda configurar su trabajo de generación de datos sintéticos, también para bases de datos y conjuntos de datos de varias tablas.

Integridad referencial preservada

Syntho admite la inferencia y la síntesis automáticas de relaciones de tablas. Inferimos y generamos automáticamente claves primarias y externas que reflejan sus tablas de origen y protegen las relaciones en sus bases de datos y en diferentes sistemas para preservar la integridad referencial. Las relaciones de clave externa se capturan automáticamente de su base de datos para preservar la integridad referencial. Alternativamente, se puede ejecutar un escaneo para buscar posibles relaciones de clave externa (cuando las claves externas no están definidas en la base de datos, pero por ejemplo en la capa de aplicación) o se pueden agregar manualmente.

Operaciones integrales de tablas y columnas

Sintetice, duplique o excluya tablas o columnas según sus preferencias. Cuando sintetiza una base de datos con varias tablas, normalmente le gustaría poder configurar el trabajo de generación de datos sintéticos para incluir y/o excluir la combinación deseada de tablas.

Modos de mesa:

  • Sintetizar: use IA para sintetizar la tabla
  • Duplicar: copiar la tabla encima como es a la base de datos de destino
  • Excluir: excluir la tabla de la base de datos de destino
conjuntos de datos de varias tablas

Soporte de datos complejos

Syntho admite datos sintéticos que contienen datos de series temporales

Syntho también admite datos de series temporales. Los datos de series temporales son un tipo de datos que se recopilan y organizan en orden cronológico, y cada punto de datos representa un punto específico en el tiempo. Este tipo de datos es de uso común en muchos sectores. Esto podría ser, por ejemplo, en finanzas (por ejemplo, con clientes que realizan transacciones) o en atención médica (donde los pacientes se someten a procedimientos), y muchos otros en los que es importante comprender las tendencias y los patrones a lo largo del tiempo.

Los datos de series de tiempo se pueden recopilar a intervalos regulares o irregulares. Los datos pueden ser univariados, que consisten en una sola variable, como la temperatura, o multivariantes, que consisten en múltiples variables que se miden a lo largo del tiempo, como el valor de una cartera de acciones o los ingresos y gastos de una empresa.

El análisis de datos de series temporales a menudo implica identificar patrones, tendencias y fluctuaciones estacionales a lo largo del tiempo, así como hacer predicciones sobre valores futuros basados ​​en datos anteriores. La información obtenida del análisis de datos de series temporales se puede utilizar para una amplia gama de aplicaciones, como pronosticar ventas, predecir el clima o detectar anomalías en una red. Por lo tanto, a menudo se requiere soporte para datos de series temporales al sintetizar datos.

Tipos admitidos de datos de series temporales

Las autocorrelaciones están incluidas en nuestro informe de control de calidad.

Datos admitidos

Syntho admite cualquier forma de datos tabulares

Tipo de datos Descripción Ejemplo
Entero Un número entero sin lugares decimales, ya sea positivo o negativo 42
Flotador Un número decimal con un número finito o infinito de lugares decimales, ya sea positivo o negativo 3,14
Boolean Un valor binario Verdadero o falso, sí o no, etc.
Cordón Una secuencia de caracteres, como letras, dígitos, símbolos o espacios, que representan texto, categorías u otros datos. "¡Hola Mundo!"
Fecha / Hora Un valor que representa un punto específico en el tiempo, ya sea una fecha, una hora o ambos (se admite cualquier formato de datos/hora) 2023-02-18 13:45:00
Objeto Un tipo de datos complejo que puede contener varios valores y propiedades, también conocido como diccionario, mapa o tabla hash { "nombre": "Juan", "edad": 30, "dirección": "123 Main St." }
Formación Una colección ordenada de valores del mismo tipo, también conocida como lista o vector [1, 2, 3, 4, 5]
Nulo Un valor especial que representa la ausencia de cualquier dato, a menudo utilizado para indicar un valor faltante o desconocido nulo
Caracter Un solo carácter, como una letra, un dígito o un símbolo 'UNA'
Cualquier otro Se admite cualquier otra forma de datos tabulares

Documentación del usuario

¡Solicite la documentación del usuario de Syntho!