A Crash natierlech syntheteschen Donnéeën


Léier méi


Kontaktéiert eis

Aféierung

Wat sinn synthetesch Daten?

D'Äntwert ass relativ einfach. Wärend originell Donnéeën an all Ären Interaktioune mat realen Persounen gesammelt ginn (zB Clienten, Patienten, Mataarbechter etc.) an iwwer all Är intern Prozesser ginn synthetesch Donnéeën vun engem Computeralgorithmus generéiert. Dëse Computeralgorithmus generéiert komplett nei a kënschtlech Datepunkte.

Los Dateschutz Erausfuerderungen

Synthetesch generéiert Donnéeën besteet aus komplett neien a kënschtlechen Datepunkte ouni een-zu-eent Relatiounen zu den ursprénglechen Donnéeën. Dofir kann kee vun de syntheteschen Datepunkte zréckverfollegt oder ëmgedréint ginn op originell Daten. Als Resultat sinn synthetesch Donnéeën befreit vu Privatsphärreglementer, sou wéi de GDPR, an déngen als Léisung fir Dateschutzfuerderungen ze léisen an ze iwwerwannen.

Augmentéieren a simuléieren

De generativen Aspekt vun der synthetescher Dategeneratioun erlaabt et komplett nei Daten ze vergréisseren an ze simuléieren. Dëst funktionéiert als Léisung wann Dir net genuch Daten hutt (Dateknappheet), wëllt Rand-Fäll up-probéieren oder wann Dir nach keng Daten hutt.

Hei ass de Fokus vu Syntho strukturéiert Donnéeën (Daten formatéiert an Dëscher mat Reihen a Kolonnen, sou wéi Dir an engem Excel Blat gesitt), awer mir illustréiere ëmmer gär d'Konzept vu syntheteschen Donnéeën iwwer Biller, well se méi attraktiv sinn.

Aarte vu syntheteschen Daten

Dräi Aarte vu syntheteschen Daten existéieren am syntheteschen Dateparaplu. Déi 3 Aarte vu syntheteschen Donnéeën sinn: Dummy-Daten, Regel-baséiert generéiert synthetesch Donnéeën a synthetesch Donnéeën generéiert vu kënschtlecher Intelligenz (AI). Mir erkläre kuerz wat déi 3 verschidden Aarte vu syntheteschen Date sinn.

Dummy Daten / Spottdaten

Dummy Daten sinn zoufälleg generéiert Daten (zB duerch e Spottdatengenerator).

Dofir sinn Charakteristiken, Bezéiungen a statistesch Musteren, déi an den ursprénglechen Donnéeën sinn, net konservéiert, ageholl a reproduzéiert an de generéierten Dummydaten. Dofir ass d'Representativitéit vun Dummydaten / Spottdaten minimal am Verglach mat den originelle Daten.

  • Wann Dir se benotzt: fir direkt Identifizéierer (PII) ze ersetzen oder wann Dir keng Daten hutt (nach) an net wëllt Zäit an Energie verbréngen fir Reegelen ze definéieren.

Regelbaséiert generéiert synthetesch Daten

Regelbaséiert generéiert synthetesch Donnéeën sinn synthetesch Donnéeën generéiert vun engem virdefinéierte Set vu Reegelen. Beispiller vun deene virdefinéierte Reegele kéinte sinn datt Dir synthetesch Donnéeën mat engem bestëmmte Minimumwäert, Maximumwäert oder Duerchschnëttswäert wëllt hunn. All Charakteristiken, Bezéiungen a statistesch Musteren, déi Dir gär hätt an de regelbaséiert generéiert syntheteschen Donnéeën reproduzéiert ze hunn, muss virdefinéiert ginn.

Dofir wäert d'Datequalitéit sou gutt sinn wéi de virdefinéierte Set vu Reegelen. Dëst resultéiert zu Erausfuerderunge wann héich Datequalitéit vun der Essenz ass. Als éischt kann een nëmmen eng limitéiert Rei vu Regelen definéieren fir an de syntheteschen Donnéeën erfaasst ze ginn. Zousätzlech wäert d'Opstelle vu verschidde Reegelen typesch zu iwwerlappende a konfliktende Reegele féieren. Desweideren, Dir wäert ni all relevant Regelen komplett Cover. Ausserdeem kënnen et relevant Reegele sinn, déi Dir net emol bewosst sidd. A schlussendlech (an net ze vergiessen), dëst wäert Iech vill Zäit an Energie huelen, wat zu enger net effizienter Léisung resultéiert.

  • Wann Dir se benotzt: Wann Dir keng Daten hutt (nach)

Synthetesch Daten generéiert duerch kënschtlech Intelligenz (AI)

Wéi Dir vum Numm erwaart, sinn synthetesch Donnéeën generéiert vu kënschtlecher Intelligenz (AI) synthetesch Donnéeën generéiert vun engem kënschtlechen Intelligenz (AI) Algorithmus. Den AI Modell gëtt op den originelle Daten trainéiert fir all Charakteristiken, Bezéiungen a statistesch Mustere ze léieren. Duerno ass dësen AI Algorithmus fäeg komplett nei Datepunkte ze generéieren an déi nei Datepunkte sou ze modelléieren datt et d'Charakteristiken, Bezéiungen a statistesch Mustere vun der ursprénglecher Dataset reproduzéiert. Dëst ass wat mir e syntheteschen Date-Zwilling nennen.

Den AI Modell mimics originell Donnéeën fir synthetesch Donnéeën Zwillinge ze generéieren déi kënne benotzt ginn wéi wann et originell Donnéeën ass. Dëst späert verschidde Benotzungsfäll op, wou d'AI generéiert synthetesch Donnéeën als Alternativ benotzt kënne fir originell (sensibel) Donnéeën ze benotzen, sou wéi d'Benotzung vun AI generéiert syntheteschen Donnéeën als Testdaten, Demo-Daten oder fir Analyse.

Eng Visualiséierung wéi synthetesch Donnéeën erstallt ginn

Am Verglach mat regelbaséiert generéiert syntheteschen Donnéeën: amplaz datt Dir relevant Regelen studéiert an definéiert, mécht den AI Algorithmus dëst automatesch fir Iech. Hei ginn net nëmmen Charakteristiken, Bezéiungen a statistesch Musteren, déi Dir bewosst sidd, ofgedeckt, och Charakteristiken, Bezéiungen a statistesch Musteren, déi Dir net emol bewosst sidd.

  • Wann Dir et benotzt: wann Dir (e puer) Daten als Input hutt fir ze mimikéieren oder als Startpunkt fir Smart Date Generatioun an Augmentatiounsfeatures ze benotzen

Wéi eng Zort syntheteschen Donnéeën ze benotzen?

Ofhängeg vun Ärem Benotzungsfall ass eng Kombinatioun vun Dummydaten / Spottdaten, Regelbaséiert generéiert syntheteschen Daten oder syntheteschen Daten generéiert vu kënschtlecher Intelligenz (AI) ugeroden. Dësen Iwwerbléck gëtt Iech eng éischt Indikatioun, wéi eng Zort syntheteschen Donnéeën ze benotzen. Well Syntho se all ënnerstëtzt, fillt Iech gratis eis Experten ze kontaktéieren fir Äre Gebrauchsfall mat eis ze verdéiwen.

Dës Grafik stellt verschidden Aarte vu syntheteschen Daten vir

Syntho Guide Cover

Späichert Äre syntheteschen Dateguide elo!