De ondersteunde data van de Syntho Engine

Behoud referentiële integriteit in een volledig relationeel data-ecosysteem

Demo Aanvragen

Syntho ondersteunt elke vorm van data in tabelvorm

Syntho ondersteunt elke vorm van tabeldata en ondersteunt ook complexe datatypen. Tabeldata zijn een type gestructureerde data die zijn georganiseerd in rijen en kolommen, meestal in de vorm van een tabel. Meestal ziet u dit type data in databases, spreadsheets en andere databeheersystemen.

Tijdreeksdata
Tijdreeksdata

Genereer synthetische datasets om tijdgebaseerde patronen te simuleren voor analyse en prognose.

Datasets en databases met meerdere tabellen
Datasets en databases met meerdere tabellen

Maak synthetische datasets over meerdere tabellen om complexe databasestructuren te repliceren.

Elke taal
Elke taal
(Nederlands, Engels etc.)

Genereer data in elke taal voor uiteenlopende toepassingen.

Elk alfabet
Elk alfabet
(Engels, Chinees, Japans etc.)

Produceer data in verschillende alfabetten voor wereldwijd gebruik.

Geografische locatiedata
Geografische locatiedata
(zoals GPS)

Genereer realistische GPS- en locatiegebaseerde data voor georuimtelijke toepassingen.

Grote multi-tabel datasets
& databanken

Syntho ondersteunt grote datasets met meerdere tabellen en databases. Ook voor datasets met meerdere tabellen en databases maximaliseren we de datanauwkeurigheid voor elke taak voor het genereren van synthetische data en demonstreren we dit via ons datakwaliteitsrapport. Daarnaast hebben de data-experts van SAS onze synthetische data extern beoordeeld en goedgekeurd.

We hebben ons platform geoptimaliseerd om de rekenvereisten te minimaliseren (bijv. geen GPU vereist), zonder afbreuk te doen aan de datanauwkeurigheid. Bovendien ondersteunen we automatisch schalen, zodat men enorme databases kan synthetiseren.

Specifiek voor multi-table datasets en databases detecteren we automatisch de datatypes, schema's en formaten om de nauwkeurigheid van de data te maximaliseren. Voor multi-table databases ondersteunen we automatische tabelrelatie-inferentie en -synthese. Tot slot ondersteunen we uitgebreide tabel- en kolombewerkingen, zodat u uw synthetische datageneratietaak kunt configureren, ook voor multi-table datasets en databases.

Bewaarde referentiële integriteit

Syntho ondersteunt automatische tabelrelatie-inferentie en -synthese. We infereren en genereren automatisch primaire en vreemde sleutels die uw brontabellen weerspiegelen en beschermen relaties in uw databases en in verschillende systemen om de referentiële integriteit te behouden. Vreemde sleutelrelaties worden automatisch vastgelegd in uw database om de referentiële integriteit te behouden.

Als alternatief kan men een scan uitvoeren om te zoeken naar mogelijke relaties tussen externe sleutels (wanneer externe sleutels niet in de database zijn gedefinieerd, maar bijvoorbeeld wel in de applicatielaag) of men kan ze handmatig toevoegen.

Bewaarde referentiële integriteit

Uitgebreide tabel- en kolombewerkingen

Synthetiseer, dupliceer of sluit tabellen of kolommen naar uw voorkeur uit. Wanneer u een database met meerdere tabellen synthetiseert, wilt u doorgaans de taak voor het genereren van synthetische data kunnen configureren om de gewenste combinatie van tabellen op te nemen en/of uit te sluiten.

Tabel modi:

  • Synthetiseren: gebruik AI om de tabel te synthetiseren
  • Dupliceren: Anonimiseer persoonlijk identificeerbare informatie (PII) of dupliceer de tabel 
  • Uitsluiten: Sluit de tabel uit van de doeldatabase
Uitgebreide tabel- en kolombewerkingen

Gebruikersdocumentatie

Verken de Syntho-gebruikersdocumentatie

Meer informatie

Ondersteuning voor tijdreeksdata

Syntho biedt ook ondersteuning voor tijdreeksdata. Tijdreeksdata zijn data die in chronologische volgorde worden verzameld en georganiseerd, waarbij elk datapunt een specifiek tijdstip vertegenwoordigt.

Dit type data wordt veel gebruikt in veel sectoren. Dit kan bijvoorbeeld in de financiële sector zijn (bijvoorbeeld bij klanten die transacties doen) of in de gezondheidszorg (waar patiënten procedures ondergaan), en vele andere sectoren waar trends en patronen in de loop van de tijd belangrijk zijn om te begrijpen.

Tijdreeksdata kunnen met regelmatige of onregelmatige tussenpozen worden verzameld. De data kunnen univariaat zijn, bestaande uit een enkele variabele zoals temperatuur, of multivariaat, bestaande uit meerdere variabelen die in de loop van de tijd worden gemeten, zoals de waarde van een aandelenportefeuille of de inkomsten en uitgaven van een bedrijf.

Het analyseren van tijdreeksdata omvat vaak het identificeren van patronen, trends en seizoensfluctuaties in de loop van de tijd, evenals het maken van voorspellingen over toekomstige waarden op basis van data uit het verleden. De inzichten die worden verkregen door het analyseren van tijdreeksdata kunnen worden gebruikt voor een breed scala aan toepassingen, zoals het voorspellen van verkopen, het voorspellen van het weer of het detecteren van anomalieën in een netwerk. Daarom is ondersteuning voor tijdreeksdata vaak vereist bij het synthetiseren van data.

Ondersteunde tijdstypen
seriedata

  • Tijdreeks met gelijk interval
  • Tijdreeks met ongelijk interval
  • Tijdreeksen met gelijke lengtes
  • Tijdreeksen met ongelijke lengtes
  • Tijdreeks met ontbrekende waarnemingen
  • Enorme tijdreeksreeksen

Autocorrelaties zijn inbegrepen in
ons kwaliteitsborgingsrapport

Overzicht van data die Syntho ondersteunt

Data typeBeschrijvingVoorbeeld
Geheel getalEen geheel getal zonder decimalen, zowel positief als negatief42
VlotterEen decimaal getal met een eindig of oneindig aantal decimalen, positief of negatief3,14
BooleanEen binaire waardeWaar of niet waar, ja of nee enz.
DraadEen reeks tekens, zoals letters, cijfers, symbolen of spaties, die tekst, categorieën of andere data vertegenwoordigen"Hallo Wereld!"
Datum / TijdEen waarde die een specifiek tijdstip vertegenwoordigt, een datum, een tijd of beide (elke data-/tijdnotatie wordt ondersteund)2023-02-18 13:45:00
ObjectEen complex datatype dat meerdere waarden en eigenschappen kan bevatten, ook wel een woordenboek, kaart of hashtabel genoemd{ “naam”: “John”, “leeftijd”: 30, “adres”: “123 Main St.” }
reeksEen geordende verzameling waarden van hetzelfde type, ook wel een lijst of vector genoemd[1, 2, 3, 4, 5]
NullEen speciale waarde die de afwezigheid van data vertegenwoordigt, vaak gebruikt om een ​​ontbrekende of onbekende waarde aan te gevennul
Karakter
Een enkel teken, zoals een letter, cijfer of symbool
'EEN'
Enig anderElke andere vorm van tabeldata wordt ondersteund-

Bouw beter en sneller met synthetische data vandaag

Ontgrendel datatoegang, versnel de ontwikkeling en verbeter de dataprivacy.

Schrijf je in op onze nieuwsbrief

Blijf op de hoogte van het laatste nieuws over synthetische data