Ang suportadong data ng Syntho Engine

Anong mga uri ng data ang sinusuportahan ng Syntho?

Sinusuportahan ng Syntho ang anumang anyo ng tabular na data

Syntho sumusuporta sa anumang anyo ng tabular data at sinusuportahan din ang mga kumplikadong uri ng data. Ang tabular data ay isang uri ng structured data na nakaayos sa mga row at column, karaniwang nasa anyo ng isang table. Kadalasan, nakikita mo ang ganitong uri ng data sa mga database, spreadsheet, at iba pang sistema ng pamamahala ng data.

Pagsuporta sa kumplikadong data

Pagsuporta sa kumplikadong data

Sinusuportahan ng Syntho ang malalaking multi-table dataset at database

Sinusuportahan ng Syntho ang malalaking multi-table dataset at database. Para din sa mga multi-table na dataset at database, pina-maximize namin ang katumpakan ng data para sa bawat synthetic na data generation job at ipinapakita ito sa pamamagitan ng aming ulat sa kalidad ng data. Bilang karagdagan, tinasa at inaprubahan ng mga eksperto sa data ng SAS ang aming sintetikong data mula sa panlabas na pananaw.

In-optimize namin ang aming platform para mabawasan ang mga kinakailangan sa computational (hal. walang GPU na kailangan), nang hindi nakompromiso ang katumpakan ng data. Bilang karagdagan, sinusuportahan namin ang auto scaling, upang ang isa ay makapag-synthesize ng malalaking database.

Partikular para sa mga multi-table na dataset at database, awtomatiko naming nade-detect ang mga uri ng data, schema at mga format para ma-maximize ang katumpakan ng data. Para sa multi-table database, sinusuportahan namin ang awtomatikong inference at synthesis ng relasyon sa talahanayan pangalagaan ang referential integrity. Sa wakas, sinusuportahan namin ang komprehensibong pagpapatakbo ng talahanayan at hanay para ma-configure mo ang iyong synthetic na data generation job, para din sa mga multi-table dataset at database.

Napanatili ang integridad ng referential

Sinusuportahan ng Syntho ang awtomatikong inference at synthesis ng relasyon sa talahanayan. Awtomatiko kaming naghihinuha at bumubuo ng mga pangunahin at dayuhang key na sumasalamin sa iyong mga talahanayan ng pinagmulan at pinangangalagaan ang mga ugnayan sa iyong mga database at sa iba't ibang system upang mapanatili ang integridad ng referential. Ang mga dayuhang pangunahing relasyon ay awtomatikong kinukuha mula sa iyong database upang mapanatili ang integridad ng referential. Bilang kahalili, ang isa ay maaaring magpatakbo ng isang pag-scan upang mag-scan para sa mga potensyal na dayuhang key na relasyon (kapag ang mga dayuhang key ay hindi tinukoy sa database, ngunit halimbawa sa layer ng aplikasyon) o isa ay maaaring magdagdag ng mga ito nang manu-mano.

Comprehensive table at column operations

I-synthesize, i-duplicate o ibukod ang mga talahanayan o column ayon sa iyong kagustuhan. Kapag nag-synthesize ka ng database na may maraming mga talahanayan, karaniwang nais ng isa na ma-configure ang synthetic na data generation job upang isama at/o ibukod ang gustong kumbinasyon ng mga talahanayan.

Mga mode ng talahanayan:

  • Synthesize: Gamitin ang AI para i-synthesize ang talahanayan
  • Duplicate: kopyahin ang talahanayan as-ay sa target na database
  • Ibukod: ibukod ang talahanayan mula sa target na database
mga dataset ng maraming talahanayan

Pagsuporta sa kumplikadong data

Sinusuportahan ng Syntho ang synthetic na data na naglalaman ng data ng time series

Sinusuportahan din ng Syntho ang data ng serye ng oras. Ang data ng serye ng oras ay isang uri ng data na kinokolekta at inayos ayon sa pagkakasunod-sunod, na ang bawat punto ng data ay kumakatawan sa isang partikular na punto ng oras. Ang ganitong uri ng data ay karaniwang ginagamit sa maraming sektor. Ito ay maaaring halimbawa sa pananalapi (halimbawa sa mga customer na gumagawa ng mga transaksyon) o sa pangangalagang pangkalusugan (kung saan ang mga pasyente ay sumasailalim sa mga pamamaraan), at marami pang iba kung saan ang mga uso at pattern sa paglipas ng panahon ay mahalagang maunawaan.

Maaaring kolektahin ang data ng serye ng oras sa regular o hindi regular na mga agwat. Ang data ay maaaring univariate, na binubuo ng iisang variable gaya ng temperatura, o multivariate, na binubuo ng maraming variable na sinusukat sa paglipas ng panahon, gaya ng halaga ng stock portfolio o kita at gastos ng kumpanya.

Ang pagsusuri sa data ng time series ay kadalasang nagsasangkot ng pagtukoy ng mga pattern, trend, at seasonal fluctuation sa paglipas ng panahon, pati na rin ang paggawa ng mga hula tungkol sa mga value sa hinaharap batay sa nakaraang data. Ang mga insight na nakuha mula sa pagsusuri ng data ng time series ay maaaring gamitin para sa malawak na hanay ng mga application, gaya ng paghula ng mga benta, paghula sa lagay ng panahon, o pag-detect ng mga anomalya sa isang network. Samakatuwid, ang pagsuporta sa data ng time series ay madalas na kinakailangan kapag nagsi-synthesize ng data.

Mga sinusuportahang uri ng data ng time series

Ang mga auto-correlation ay kasama sa aming ulat sa pagtiyak sa kalidad

Sinusuportahang data

Sinusuportahan ng Syntho ang anumang anyo ng tabular na data

Uri ng datos paglalarawan halimbawa
Integer Isang buong numero na walang anumang decimal na lugar, positibo man o negatibo 42
Karosa Isang decimal na numero na may hangganan o walang katapusang bilang ng mga decimal na lugar, positibo man o negatibo 3,14
boolean Isang binary na halaga Tama o mali, oo o hindi atbp.
Pisi Isang pagkakasunud-sunod ng mga character, tulad ng mga titik, digit, simbolo, o espasyo, na kumakatawan sa teksto, mga kategorya o iba pang data "Hello, mundo!"
Petsa / Oras Isang value na kumakatawan sa isang partikular na punto sa oras, alinman sa isang petsa, isang oras, o pareho (anumang format ng data/oras ay sinusuportahan) 2023-02-18 13:45:00
Bagay Isang kumplikadong uri ng data na maaaring maglaman ng maraming value at property, na kilala rin bilang isang diksyunaryo, mapa, o hash table { "pangalan": "John", "edad": 30, "address": "123 Main St." }
Ayos Isang nakaayos na koleksyon ng mga halaga ng parehong uri, na kilala rin bilang isang listahan o vector [1, 2, 3, 4, 5]
Walang bisa Isang espesyal na halaga na kumakatawan sa kawalan ng anumang data, kadalasang ginagamit upang ipahiwatig ang isang nawawala o hindi alam na halaga walang halaga
Katangian Isang character, tulad ng isang titik, digit, o simbolo 'A'
Anumang iba pang mga Anumang iba pang anyo ng tabular data ay sinusuportahan

Dokumentasyon ng gumagamit

Humiling ng Dokumentasyon ng Gumagamit ni Syntho!