De ondersteunde data van de Syntho Engine

Welke soorten data worden door Syntho ondersteund?

Syntho ondersteunt elke vorm van data in tabelvorm

syntho ondersteunt elke vorm van data in tabelvorm en ondersteunt ook complexe datatypen. Gegevens in tabelvorm zijn gestructureerde data die zijn georganiseerd in rijen en kolommen, meestal in de vorm van een tabel. Meestal zie je dit soort data in databases, spreadsheets en andere databeheersystemen.

Ondersteuning voor complexe data

Ondersteuning voor complexe data

Syntho ondersteunt grote datasets met meerdere tabellen en databases

Syntho ondersteunt grote datasets met meerdere tabellen en databases. Ook voor datasets met meerdere tabellen en databases maximaliseren we de datanauwkeurigheid voor elke taak voor het genereren van synthetische data en demonstreren we dit via ons datakwaliteitsrapport. Daarnaast hebben de data-experts van SAS onze synthetische data extern beoordeeld en goedgekeurd.

We hebben ons platform geoptimaliseerd om de rekenvereisten te minimaliseren (bijv. geen GPU vereist), zonder afbreuk te doen aan de datanauwkeurigheid. Bovendien ondersteunen we automatisch schalen, zodat men enorme databases kan synthetiseren.

Specifiek voor datasets en databases met meerdere tabellen detecteren we automatisch de datatypes, schema's en formaten om de datanauwkeurigheid te maximaliseren. Voor databases met meerdere tabellen ondersteunen we automatische gevolgtrekking en synthese van tabelrelaties behoud van de referentiële integriteit. Tot slot ondersteunen we voor uitgebreide tabel- en kolombewerkingen zodat u uw taak voor het genereren van synthetische data kunt configureren, ook voor datasets met meerdere tabellen en databases.

Bewaarde referentiële integriteit

Syntho ondersteunt automatische gevolgtrekking en synthese van tabelrelaties. We leiden automatisch primaire en externe sleutels af en genereren deze die uw brontabellen weerspiegelen en beschermen relaties in uw databases en tussen verschillende systemen om de referentiële integriteit te behouden. Externe sleutelrelaties worden automatisch uit uw database gehaald om de referentiële integriteit te behouden. Als alternatief kan men een scan uitvoeren om te scannen op mogelijke externe sleutelrelaties (wanneer externe sleutels niet in de database zijn gedefinieerd, maar bijvoorbeeld in de applicatielaag) of men kan ze handmatig toevoegen.

Uitgebreide tabel- en kolombewerkingen

Synthetiseer, dupliceer of sluit tabellen of kolommen naar uw voorkeur uit. Wanneer u een database met meerdere tabellen synthetiseert, wilt u doorgaans de taak voor het genereren van synthetische data kunnen configureren om de gewenste combinatie van tabellen op te nemen en/of uit te sluiten.

Tabel modi:

  • Synthetiseren: gebruik AI om de tabel te synthetiseren
  • Dupliceren: kopieer de tabel over zoals het is naar de doeldatabase
  • Uitsluiten: sluit de tabel uit van de doeldatabase
datasets met meerdere tabellen

Ondersteuning voor complexe data

Syntho ondersteunt synthetische data met tijdreeksdata

Syntho ondersteunt ook voor tijdreeksdata. tijdreeksdata is een type data dat in chronologische volgorde wordt verzameld en geordend, waarbij elk datapunt een specifiek tijdstip vertegenwoordigt. Dit type data wordt in veel sectoren veel gebruikt. Dit kan bijvoorbeeld in de financiële wereld zijn (bijvoorbeeld met klanten die transacties doen) of in de gezondheidszorg (waar patiënten procedures ondergaan), en vele andere waar trends en patronen in de loop van de tijd belangrijk zijn om te begrijpen.

Tijdreeksdata kunnen met regelmatige of onregelmatige tussenpozen worden verzameld. De data kunnen univariaat zijn, bestaande uit een enkele variabele zoals temperatuur, of multivariaat, bestaande uit meerdere variabelen die in de loop van de tijd worden gemeten, zoals de waarde van een aandelenportefeuille of de inkomsten en uitgaven van een bedrijf.

Het analyseren van tijdreeksdata omvat vaak het identificeren van patronen, trends en seizoensfluctuaties in de loop van de tijd, evenals het maken van voorspellingen over toekomstige waarden op basis van data uit het verleden. De inzichten die worden verkregen door het analyseren van tijdreeksdata kunnen worden gebruikt voor een breed scala aan toepassingen, zoals het voorspellen van verkopen, het voorspellen van het weer of het detecteren van anomalieën in een netwerk. Daarom is ondersteuning voor tijdreeksdata vaak vereist bij het synthetiseren van data.

Ondersteunde typen tijdreeksdata

Auto-correlaties zijn opgenomen in ons kwaliteitsborgingsrapport

Ondersteunde data

Syntho ondersteunt elke vorm van data in tabelvorm

Data type Omschrijving Voorbeeld
Geheel getal Een geheel getal zonder decimalen, zowel positief als negatief 42
Vlotter Een decimaal getal met een eindig of oneindig aantal decimalen, positief of negatief 3,14
Boolean Een binaire waarde Waar of niet waar, ja of nee enz.
Draad Een reeks tekens, zoals letters, cijfers, symbolen of spaties, die tekst, categorieën of andere data vertegenwoordigen "Hallo Wereld!"
Datum / Tijd Een waarde die een specifiek tijdstip vertegenwoordigt, een datum, een tijd of beide (elke data-/tijdnotatie wordt ondersteund) 2023-02-18 13:45:00
Object Een complex datatype dat meerdere waarden en eigenschappen kan bevatten, ook wel een woordenboek, kaart of hashtabel genoemd { "name": "John", "age": 30, "address": "123 Main St." }
reeks Een geordende verzameling waarden van hetzelfde type, ook wel een lijst of vector genoemd [1, 2, 3, 4, 5]
Null Een speciale waarde die de afwezigheid van data vertegenwoordigt, vaak gebruikt om een ​​ontbrekende of onbekende waarde aan te geven nul
Karakter Een enkel teken, zoals een letter, cijfer of symbool 'EEN'
Enig ander Elke andere vorm van tabeldata wordt ondersteund

Gebruikersdocumentatie

Vraag de gebruikersdocumentatie van Syntho aan!