Τι είναι συνθετικά δεδομένα;

Συνθετικά δεδομένα μαθημάτων συντριβής

 

 

Εισαγωγή

Τι είναι συνθετικά δεδομένα;

Η απάντηση είναι σχετικά απλή. Ενώ τα πρωτότυπα δεδομένα συλλέγονται σε όλες τις αλληλεπιδράσεις σας με πραγματικά πρόσωπα (π.χ. πελάτες, ασθενείς, εργαζόμενους κ.λπ.) και μέσω όλων των εσωτερικών διαδικασιών σας, τα συνθετικά δεδομένα παράγονται από έναν αλγόριθμο υπολογιστή. Αυτός ο αλγόριθμος υπολογιστή δημιουργεί εντελώς νέα και τεχνητά σημεία δεδομένων.

Επίλυση προκλήσεων απορρήτου δεδομένων

Τα δεδομένα που δημιουργούνται συνθετικά αποτελούνται από εντελώς νέα και τεχνητά σημεία δεδομένων χωρίς σχέσεις ένας προς έναν με τα αρχικά δεδομένα. Ως εκ τούτου, κανένα από τα συνθετικά σημεία δεδομένων δεν μπορεί να ανιχνευθεί ή να αντιστραφεί στα αρχικά δεδομένα. Ως αποτέλεσμα, τα συνθετικά δεδομένα εξαιρούνται από τους κανονισμούς περί απορρήτου, όπως ο GDPR και χρησιμεύουν ως λύση για την επίλυση και την αντιμετώπιση προκλήσεων σχετικά με την προστασία της ιδιωτικής ζωής.

Αύξηση και προσομοίωση

Η παραγωγική πτυχή της δημιουργίας συνθετικών δεδομένων επιτρέπει την αύξηση και την προσομοίωση εντελώς νέων δεδομένων. Αυτό λειτουργεί ως λύση όταν δεν έχετε αρκετά δεδομένα (σπανιότητα δεδομένων), θέλετε να κάνετε δειγματοληψία ακραίων περιπτώσεων ή όταν δεν έχετε ακόμα δεδομένα.

Εδώ, η εστίαση του Syntho είναι δομημένα δεδομένα (δεδομένα μορφοποιημένα σε πίνακες που περιέχουν γραμμές και στήλες, όπως βλέπετε σε φύλλα Excel), αλλά πάντα μας αρέσει να απεικονίζουμε την έννοια των συνθετικών δεδομένων μέσω εικόνων, επειδή είναι πιο ελκυστική.

Τύποι συνθετικών δεδομένων

Τρεις τύποι συνθετικών δεδομένων υπάρχουν στην ομπρέλα των συνθετικών δεδομένων. Αυτοί οι 3 τύποι συνθετικών δεδομένων είναι: εικονικά δεδομένα, συνθετικά δεδομένα που δημιουργούνται βάσει κανόνων και συνθετικά δεδομένα που παράγονται από τεχνητή νοημοσύνη (AI). Εξηγούμε σύντομα ποιοι είναι οι 3 διαφορετικοί τύποι συνθετικών δεδομένων.

εικονικά δεδομένα / εικονικά δεδομένα

Τα εικονικά δεδομένα είναι δεδομένα που δημιουργούνται τυχαία (π.χ. από μια εικονική γεννήτρια δεδομένων).

Κατά συνέπεια, τα χαρακτηριστικά, οι σχέσεις και τα στατιστικά μοτίβα που υπάρχουν στα αρχικά δεδομένα δεν διατηρούνται, καταγράφονται και αναπαράγονται στα δημιουργούμενα εικονικά δεδομένα. Ως εκ τούτου, η αντιπροσωπευτικότητα των εικονικών δεδομένων / εικονικών δεδομένων είναι ελάχιστη σε σύγκριση με τα αρχικά δεδομένα.

  • Πότε να το χρησιμοποιήσετε: για να αντικαταστήσετε άμεσα αναγνωριστικά (PII) ή όταν δεν έχετε δεδομένα (ακόμα) και δεν θέλετε να ξοδέψετε χρόνο και ενέργεια για τον καθορισμό κανόνων.

Συνθετικά δεδομένα που βασίζονται σε κανόνες

Τα συνθετικά δεδομένα που δημιουργούνται βάσει κανόνων είναι συνθετικά δεδομένα που παράγονται από ένα προκαθορισμένο σύνολο κανόνων. Παραδείγματα αυτών των προκαθορισμένων κανόνων μπορεί να είναι ότι θα θέλατε να έχετε συνθετικά δεδομένα με μια συγκεκριμένη ελάχιστη τιμή, μέγιστη τιμή ή μέση τιμή. Οποιαδήποτε από τα χαρακτηριστικά, τις σχέσεις και τα στατιστικά μοτίβα που θα θέλατε να έχουν αναπαραχθεί στα συνθετικά δεδομένα που δημιουργούνται βάσει κανόνων, πρέπει να είναι προκαθορισμένα.

Κατά συνέπεια, η ποιότητα των δεδομένων θα είναι τόσο καλή όσο το προκαθορισμένο σύνολο κανόνων. Αυτό οδηγεί σε προκλήσεις όταν η υψηλή ποιότητα δεδομένων είναι ουσιαστική. Πρώτον, μπορεί κανείς να ορίσει μόνο ένα περιορισμένο σύνολο κανόνων που θα αποτυπωθούν στα συνθετικά δεδομένα. Επιπλέον, η ρύθμιση πολλών κανόνων θα έχει συνήθως ως αποτέλεσμα αλληλεπικαλυπτόμενους και αντικρουόμενους κανόνες. Επιπλέον, ποτέ δεν θα καλύψετε πλήρως όλους τους σχετικούς κανόνες. Επιπλέον, μπορεί να υπάρχουν σχετικοί κανόνες που δεν γνωρίζετε καν. Και τέλος (και για να μην ξεχνάμε), αυτό θα σας πάρει πολύ χρόνο και ενέργεια με αποτέλεσμα μια μη αποδοτική λύση.

  • Πότε να το χρησιμοποιήσετε: όταν δεν έχετε δεδομένα (ακόμα)

Συνθετικά δεδομένα που δημιουργούνται από τεχνητή νοημοσύνη (AI)

Όπως αναμένετε από το όνομα, τα συνθετικά δεδομένα που παράγονται από τεχνητή νοημοσύνη (AI) είναι συνθετικά δεδομένα που παράγονται από έναν αλγόριθμο τεχνητής νοημοσύνης (AI). Το μοντέλο AI εκπαιδεύεται στα αρχικά δεδομένα για να μάθει όλα τα χαρακτηριστικά, τις σχέσεις και τα στατιστικά μοτίβα. Στη συνέχεια, αυτός ο αλγόριθμος AI μπορεί να δημιουργήσει εντελώς νέα σημεία δεδομένων και να μοντελοποιήσει αυτά τα νέα σημεία δεδομένων με τέτοιο τρόπο ώστε να αναπαράγει τα χαρακτηριστικά, τις σχέσεις και τα στατιστικά μοτίβα από το αρχικό σύνολο δεδομένων. Αυτό είναι αυτό που ονομάζουμε συνθετικό δίδυμο δεδομένων.

Το μοντέλο AI μιμείται τα αρχικά δεδομένα για τη δημιουργία συνθετικών δίδυμων δεδομένων που μπορούν να χρησιμοποιηθούν σαν να είναι πρωτότυπα δεδομένα. Αυτό ξεκλειδώνει διάφορες περιπτώσεις χρήσης όπου τα συνθετικά δεδομένα που δημιουργούνται με τεχνητή νοημοσύνη μπορούν να χρησιμοποιηθούν εναλλακτικά για τη χρήση πρωτότυπων (ευαίσθητων) δεδομένων, όπως η χρήση συνθετικών δεδομένων που δημιουργούνται από AI ως δεδομένα δοκιμής, δεδομένα επίδειξης ή για αναλυτικά στοιχεία.

Μια απεικόνιση του τρόπου δημιουργίας συνθετικών δεδομένων

Σε σύγκριση με συνθετικά δεδομένα που δημιουργούνται βάσει κανόνων: αντί να μελετάτε και να ορίζετε σχετικούς κανόνες, ο αλγόριθμος AI το κάνει αυτόματα για εσάς. Εδώ, δεν θα καλυφθούν μόνο χαρακτηριστικά, σχέσεις και στατιστικά μοτίβα που γνωρίζετε, αλλά και χαρακτηριστικά, σχέσεις και στατιστικά μοτίβα που δεν γνωρίζετε καν.

  • Πότε να το χρησιμοποιήσετε: όταν έχετε (μερικά) δεδομένα ως είσοδο για μίμηση ή χρήση ως σημείο εκκίνησης για έξυπνες δυνατότητες δημιουργίας και αύξησης δεδομένων

Τι τύπο συνθετικών δεδομένων να χρησιμοποιήσετε;

Ανάλογα με την περίπτωση χρήσης σας, συνιστάται ένας συνδυασμός ψευδών δεδομένων / ψευδών δεδομένων, συνθετικών δεδομένων που δημιουργούνται βάσει κανόνων ή συνθετικών δεδομένων που παράγονται από τεχνητή νοημοσύνη (AI). Αυτή η επισκόπηση σάς παρέχει μια πρώτη ένδειξη για το είδος των συνθετικών δεδομένων που θα χρησιμοποιήσετε. Καθώς η Syntho τις υποστηρίζει όλες, μη διστάσετε να επικοινωνήσετε με τους ειδικούς μας για να εμβαθύνετε μαζί μας την περίπτωση χρήσης σας.

Αυτό το γράφημα παρουσιάζει διαφορετικούς τύπους συνθετικών δεδομένων

συνθετικό κάλυμμα οδηγού

Αποθηκεύστε τον οδηγό συνθετικών δεδομένων σας τώρα!