Dades compatibles amb el Syntho Engine

Quins tipus de dades admet Syntho?

Syntho admet qualsevol forma de dades tabulars

Syntho admet qualsevol forma de dades tabulars i també admet tipus de dades complexos. Les dades tabulars són un tipus de dades estructurades que s'organitzen en files i columnes, normalment en forma de taula. La majoria de vegades, veieu aquest tipus de dades a bases de dades, fulls de càlcul i altres sistemes de gestió de dades.

Suport de dades complexes

Suport de dades complexes

Syntho admet grans conjunts de dades i bases de dades multitaules

Syntho admet grans conjunts de dades i bases de dades multitaules. També per a conjunts de dades i bases de dades multitaules, maximitzem la precisió de les dades per a cada treball de generació de dades sintètiques i ho demostrem mitjançant el nostre informe de qualitat de les dades. A més, els experts en dades de SAS van avaluar i aprovar les nostres dades sintètiques des d'un punt de vista extern.

Hem optimitzat la nostra plataforma per minimitzar els requisits computacionals (per exemple, no es requereix GPU), sense comprometre la precisió de les dades. A més, admetem l'escalat automàtic, de manera que es poden sintetitzar grans bases de dades.

Específicament per a conjunts de dades i bases de dades multitaules, detectem automàticament els tipus de dades, els esquemes i els formats per maximitzar la precisió de les dades. Per a la base de dades multitaules, admetem la inferència i la síntesi automàtica de relacions de taules preservar la integritat referencial. Finalment, donem suport operacions completes de taules i columnes perquè pugueu configurar el vostre treball de generació de dades sintètiques, també per a conjunts de dades i bases de dades multitaules.

Integritat referencial preservada

Syntho admet la inferència i la síntesi automàtica de relacions de taules. Inferim i generem automàticament claus primàries i forasteres que reflecteixen les vostres taules font i protegim les relacions a través de les vostres bases de dades i entre diferents sistemes per preservar la integritat referencial. Les relacions de clau estrangera es capturen automàticament de la vostra base de dades per preservar la integritat referencial. Alternativament, es pot executar una exploració per cercar possibles relacions de clau estrangera (quan les claus externes no estan definides a la base de dades, però per exemple a la capa d'aplicació) o es pot afegir manualment.

Operacions completes de taules i columnes

Sintetitzeu, dupliqueu o excloeu taules o columnes segons les vostres preferències. Quan sintetitzeu una base de dades amb diverses taules, normalment un voldria poder configurar el treball de generació de dades sintètiques per incloure i/o excloure la combinació de taules desitjada.

Modes de taula:

  • Sintetitzar: utilitza la IA per sintetitzar la taula
  • Duplicar: copia la taula com és a la base de dades objectiu
  • Excloure: exclou la taula de la base de dades de destinació
conjunts de dades de múltiples taules

Suport de dades complexes

Syntho admet dades sintètiques que contenen dades de sèries temporals

Syntho també admet dades de sèries temporals. Les dades de sèries temporals són un tipus de dades que es recullen i s'organitzen en ordre cronològic, amb cada punt de dades que representa un moment específic en el temps. Aquest tipus de dades s'utilitzen habitualment en molts sectors. Això podria ser, per exemple, a les finances (per exemple, amb els clients que fan transaccions) o a l'assistència sanitària (on els pacients es sotmeten a procediments), i molts altres on les tendències i els patrons al llarg del temps són importants per entendre's.

Les dades de sèries temporals es poden recollir a intervals regulars o irregulars. Les dades poden ser univariades, consistents en una sola variable com la temperatura, o multivariades, formades per múltiples variables que es mesuren al llarg del temps, com ara el valor d'una cartera d'accions o els ingressos i despeses d'una empresa.

L'anàlisi de dades de sèries temporals sovint implica identificar patrons, tendències i fluctuacions estacionals al llarg del temps, així com fer prediccions sobre els valors futurs a partir de dades passades. Els coneixements obtinguts a partir de l'anàlisi de dades de sèries temporals es poden utilitzar per a una àmplia gamma d'aplicacions, com ara la previsió de vendes, la predicció del temps o la detecció d'anomalies en una xarxa. Per tant, sovint es requereix suport per a dades de sèries temporals en sintetitzar dades.

Tipus de dades de sèries temporals compatibles

Les autocorrelacions s'inclouen al nostre informe de garantia de qualitat

Dades suportades

Syntho admet qualsevol forma de dades tabulars

Tipus de dades Descripció exemple
Sencer Un nombre sencer sense decimals, ja sigui positiu o negatiu 42
float Un nombre decimal amb un nombre finit o infinit de decimals, ja sigui positiu o negatiu 3,14
Booleà Un valor binari Vertader o fals, sí o no, etc.
Cadena Una seqüència de caràcters, com ara lletres, dígits, símbols o espais, que representen text, categories o altres dades "Hola món!"
Date / Time Un valor que representa un moment concret, ja sigui una data, una hora o ambdues (s'admet qualsevol format de dades/hora) 2023-02-18 13:45:00
Objecte Un tipus de dades complex que pot contenir diversos valors i propietats, també conegut com a diccionari, mapa o taula hash { "name": "John", "age": 30, "address": "123 Main St." }
Formació Col·lecció ordenada de valors del mateix tipus, també conegut com a llista o vector [1, 2, 3, 4, 5]
Nul Un valor especial que representa l'absència de dades, sovint utilitzat per indicar un valor que falta o desconegut nul
Caràcter Un sol caràcter, com ara una lletra, un dígit o un símbol 'A'
Qualsevol altre S'admet qualsevol altra forma de dades tabulars

Documentació d'usuari

Sol·liciteu la documentació d'usuari de Syntho!