Os dados suportados pelo Syntho Engine

Que tipos de dados são suportados pelo Syntho?

Syntho suporta qualquer forma de dados tabulares

Sintoma suporta qualquer forma de dados tabulares e também suporta tipos de dados complexos. Dados tabulares são um tipo de dados estruturados organizados em linhas e colunas, geralmente na forma de uma tabela. Na maioria das vezes, você vê esse tipo de dados em bancos de dados, planilhas e outros sistemas de gerenciamento de dados.

suporte de dados complexos

suporte de dados complexos

O Syntho suporta grandes conjuntos de dados e bancos de dados de várias tabelas

O Syntho suporta grandes conjuntos de dados e bancos de dados de várias tabelas. Também para conjuntos de dados e bancos de dados de várias tabelas, maximizamos a precisão dos dados para cada trabalho de geração de dados sintéticos e demonstramos isso por meio de nosso relatório de qualidade de dados. Além disso, os especialistas em dados do SAS avaliaram e aprovaram nossos dados sintéticos de um ponto de vista externo.

Otimizamos nossa plataforma para minimizar os requisitos computacionais (por exemplo, sem necessidade de GPU), sem comprometer a precisão dos dados. Além disso, oferecemos suporte ao dimensionamento automático, para que seja possível sintetizar bancos de dados enormes.

Especificamente para conjuntos de dados e bancos de dados de várias tabelas, detectamos automaticamente os tipos, esquemas e formatos de dados para maximizar a precisão dos dados. Para banco de dados de várias tabelas, oferecemos suporte à inferência e síntese automática de relacionamento de tabela para preservar a integridade referencial. Finalmente, apoiamos operações abrangentes de tabelas e colunas para que você possa configurar seu trabalho de geração de dados sintéticos, também para conjuntos de dados e bancos de dados multitabelas.

Integridade referencial preservada

Syntho oferece suporte para inferência e síntese automática de relacionamento de tabela. Inferimos e geramos automaticamente chaves primárias e estrangeiras que refletem suas tabelas de origem e protegem os relacionamentos em seus bancos de dados e em diferentes sistemas para preservar a integridade referencial. Os relacionamentos de chave estrangeira são capturados automaticamente de seu banco de dados para preservar a integridade referencial. Como alternativa, pode-se executar uma varredura para procurar possíveis relações de chave estrangeira (quando as chaves estrangeiras não são definidas no banco de dados, mas, por exemplo, na camada do aplicativo) ou pode-se adicioná-las manualmente.

Operações abrangentes de tabelas e colunas

Sintetize, duplique ou exclua tabelas ou colunas de acordo com sua preferência. Quando você sintetiza um banco de dados com várias tabelas, normalmente gostaria de poder configurar o trabalho de geração de dados sintéticos para incluir e/ou excluir a combinação desejada de tabelas.

Modos de tabela:

  • Sintetizar: Use IA para sintetizar a tabela
  • Duplicar: copia a tabela como é para o banco de dados de destino
  • Excluir: exclui a tabela do banco de dados de destino
conjuntos de dados de múltiplas tabelas

suporte de dados complexos

Syntho suporta dados sintéticos contendo dados de séries temporais

Syntho suporta também dados de séries temporais. dados de séries temporais são um tipo de dados coletados e organizados em ordem cronológica, com cada ponto de dados representando um ponto específico no tempo. Este tipo de dados é comumente usado em muitos setores. Isso pode ser, por exemplo, em finanças (por exemplo, com clientes fazendo transações) ou em saúde (onde os pacientes são submetidos a procedimentos) e muitos outros em que é importante entender tendências e padrões ao longo do tempo.

Dados de séries temporais podem ser coletados em intervalos regulares ou irregulares. Os dados podem ser univariados, consistindo em uma única variável, como temperatura, ou multivariados, consistindo em múltiplas variáveis ​​que são medidas ao longo do tempo, como o valor de uma carteira de ações ou as receitas e despesas de uma empresa.

A análise de dados de séries temporais geralmente envolve a identificação de padrões, tendências e flutuações sazonais ao longo do tempo, além de fazer previsões sobre valores futuros com base em dados anteriores. Os insights obtidos com a análise de dados de séries temporais podem ser usados ​​para uma ampla gama de aplicações, como previsão de vendas, previsão do tempo ou detecção de anomalias em uma rede. Portanto, o suporte para dados de séries temporais geralmente é necessário ao sintetizar dados.

Tipos suportados de dados de séries temporais

As correlações automáticas estão incluídas em nosso relatório de garantia de qualidade

Dados compatíveis

Syntho suporta qualquer forma de dados tabulares

Tipo de dados Descrição Exemplo
Número inteiro Um número inteiro sem casas decimais, seja positivo ou negativo 42
Flutuador Um número decimal com um número finito ou infinito de casas decimais, positivo ou negativo 3,14
Booleano Um valor binário Verdadeiro ou falso, sim ou não, etc.
Tanga Uma sequência de caracteres, como letras, dígitos, símbolos ou espaços, que representam texto, categorias ou outros dados "Olá Mundo!"
Data / Hora Um valor que representa um ponto específico no tempo, seja uma data, uma hora ou ambos (qualquer formato de dados/hora é suportado) 2023-02-18 13:45:00
objeto Um tipo de dados complexo que pode conter vários valores e propriedades, também conhecido como dicionário, mapa ou tabela de hash { "nome": "John", "idade": 30, "endereço": "123 Main St." }
Ordem Uma coleção ordenada de valores do mesmo tipo, também conhecida como lista ou vetor [1, 2, 3, 4, 5]
Nulo Um valor especial que representa a ausência de quaisquer dados, geralmente usado para indicar um valor ausente ou desconhecido nulo
Personagem Um único caractere, como uma letra, dígito ou símbolo 'UMA'
Qualquer outra Qualquer outra forma de dados tabulares é suportada

Documentação do usuário

Solicite a documentação do usuário do Syntho!