De ondersteunde data van de Syntho Engine

Behoud referentiële integriteit in een volledig relationeel data-ecosysteem

Syntho ondersteunt elke vorm van data in tabelvorm

syntho ondersteunt elke vorm van data in tabelvorm en ondersteunt ook complexe datatypen. Gegevens in tabelvorm zijn gestructureerde data die zijn georganiseerd in rijen en kolommen, meestal in de vorm van een tabel. Meestal zie je dit soort data in databases, spreadsheets en andere databeheersystemen.

Tijdreeksdata

Genereer synthetische datasets om tijdgebaseerde patronen te simuleren voor analyse en prognose.

Datasets en databases met meerdere tabellen

Maak synthetische datasets over meerdere tabellen om complexe databasestructuren te repliceren.

Elke taal (Nederlands, Engels etc.)

Genereer data in elke taal voor uiteenlopende toepassingen.

Elk alfabet (Engels, Chinees, Japans etc.)

Produceer data in verschillende alfabetten voor wereldwijd gebruik.

Geografische locatiedata (zoals GPS)

Genereer realistische GPS- en locatiegebaseerde data voor georuimtelijke toepassingen.

Bekijk hier onze gebruikersdocumentatie

Grote multi-tabel datasets en databases

Syntho ondersteunt grote datasets met meerdere tabellen en databases. Ook voor datasets met meerdere tabellen en databases maximaliseren we de datanauwkeurigheid voor elke taak voor het genereren van synthetische data en demonstreren we dit via ons datakwaliteitsrapport. Daarnaast hebben de data-experts van SAS onze synthetische data extern beoordeeld en goedgekeurd.

We hebben ons platform geoptimaliseerd om de rekenvereisten te minimaliseren (bijv. geen GPU vereist), zonder afbreuk te doen aan de datanauwkeurigheid. Bovendien ondersteunen we automatisch schalen, zodat men enorme databases kan synthetiseren.

Specifiek voor datasets en databases met meerdere tabellen detecteren we automatisch de datatypes, schema's en formaten om de datanauwkeurigheid te maximaliseren. Voor databases met meerdere tabellen ondersteunen we automatische gevolgtrekking en synthese van tabelrelaties behoud van de referentiële integriteit. Tot slot ondersteunen we voor uitgebreide tabel- en kolombewerkingen zodat u uw taak voor het genereren van synthetische data kunt configureren, ook voor datasets met meerdere tabellen en databases.

Bewaarde referentiële integriteit

Syntho ondersteunt automatische tabelrelatie-inferentie en -synthese. We infereren en genereren automatisch primaire en vreemde sleutels die uw brontabellen weerspiegelen en beschermen relaties in uw databases en in verschillende systemen om de referentiële integriteit te behouden. Relaties van vreemde sleutels worden automatisch uit uw database vastgelegd om de referentiële integriteit te behouden. Als alternatief kan men een scan uitvoeren om te scannen op mogelijke relaties van vreemde sleutels (wanneer vreemde sleutels niet in de database zijn gedefinieerd, maar bijvoorbeeld in de applicatielaag) of men kan ze handmatig toevoegen.

Uitgebreide tabel- en kolombewerkingen

Synthetiseer, dupliceer of sluit tabellen of kolommen naar uw voorkeur uit. Wanneer u een database met meerdere tabellen synthetiseert, wilt u doorgaans de taak voor het genereren van synthetische data kunnen configureren om de gewenste combinatie van tabellen op te nemen en/of uit te sluiten.

Tabel modi:

  • Synthetiseren: gebruik AI om de tabel te synthetiseren
  • Duplicaat: De-identificeren persoonlijk identificeerbare informatie (PII) of dupliceer de tabel 
  • Uitsluiten: Esluit de tabel uit van de doeldatabase 
Syntho Engine-platformtabelmodi

Ondersteuning voor tijdreeksdata

Syntho ondersteunt ook voor tijdreeksdata. tijdreeksdata is een type data dat in chronologische volgorde wordt verzameld en geordend, waarbij elk datapunt een specifiek tijdstip vertegenwoordigt. Dit type data wordt in veel sectoren veel gebruikt. Dit kan bijvoorbeeld in de financiële wereld zijn (bijvoorbeeld met klanten die transacties doen) of in de gezondheidszorg (waar patiënten procedures ondergaan), en vele andere waar trends en patronen in de loop van de tijd belangrijk zijn om te begrijpen.

Tijdreeksdata kunnen met regelmatige of onregelmatige tussenpozen worden verzameld. De data kunnen univariaat zijn, bestaande uit een enkele variabele zoals temperatuur, of multivariaat, bestaande uit meerdere variabelen die in de loop van de tijd worden gemeten, zoals de waarde van een aandelenportefeuille of de inkomsten en uitgaven van een bedrijf.

Het analyseren van tijdreeksdata omvat vaak het identificeren van patronen, trends en seizoensfluctuaties in de loop van de tijd, evenals het maken van voorspellingen over toekomstige waarden op basis van data uit het verleden. De inzichten die worden verkregen door het analyseren van tijdreeksdata kunnen worden gebruikt voor een breed scala aan toepassingen, zoals het voorspellen van verkopen, het voorspellen van het weer of het detecteren van anomalieën in een netwerk. Daarom is ondersteuning voor tijdreeksdata vaak vereist bij het synthetiseren van data.

Ondersteunde typen tijdreeksdata

Auto-correlaties zijn opgenomen in ons kwaliteitsborgingsrapport

Overzicht van data die Syntho ondersteunt

Data type Beschrijving Voorbeeld
Geheel getal Een geheel getal zonder decimalen, zowel positief als negatief 42
Vlotter Een decimaal getal met een eindig of oneindig aantal decimalen, positief of negatief 3,14
Boolean Een binaire waarde Waar of niet waar, ja of nee enz.
Draad Een reeks tekens, zoals letters, cijfers, symbolen of spaties, die tekst, categorieën of andere data vertegenwoordigen "Hallo Wereld!"
Datum / Tijd Een waarde die een specifiek tijdstip vertegenwoordigt, een datum, een tijd of beide (elke data-/tijdnotatie wordt ondersteund) 2023-02-18 13:45:00
Object Een complex datatype dat meerdere waarden en eigenschappen kan bevatten, ook wel een woordenboek, kaart of hashtabel genoemd { "name": "John", "age": 30, "address": "123 Main St." }
reeks Een geordende verzameling waarden van hetzelfde type, ook wel een lijst of vector genoemd [1, 2, 3, 4, 5]
Null Een speciale waarde die de afwezigheid van data vertegenwoordigt, vaak gebruikt om een ​​ontbrekende of onbekende waarde aan te geven nul
Karakter Een enkel teken, zoals een letter, cijfer of symbool 'EEN'
Enig ander Elke andere vorm van tabeldata wordt ondersteund

Gebruikersdocumentatie

Krijg toegang tot de gebruikersdocumentatie van Syntho!