Με την κλασική ανωνυμοποίηση, υπονοούμε όλες τις μεθοδολογίες όπου κάποιος χειρίζεται ή στρεβλώνει ένα αρχικό σύνολο δεδομένων για να εμποδίσει τον εντοπισμό ατόμων.
Χαρακτηριστικά παραδείγματα κλασικής ανωνυμοποίησης που βλέπουμε στην πράξη είναι η γενίκευση, η καταστολή / σκούπισμα, η ψευδωνυμοποίηση και το ανακάτεμα γραμμών και στηλών.
Εδώ οι τεχνικές με αντίστοιχα παραδείγματα.
Τεχνική | Αρχικά δεδομένα | Χειρισμένα δεδομένα |
Γενίκευση | 27 ετών | Από 25 έως 30 ετών |
Καταστολή / Σκούπισμα | info@syntho.ai | xxxx@xxxxxx.xx |
Ψευδωνυμοποίηση | Άμστερνταμ | hVFD6td3jdHHj78ghdgrewui6 |
Ανακάτεμα γραμμής και στήλης | Ευθυγραμμισμένος | Ανακατεμένο |
Ο χειρισμός ενός συνόλου δεδομένων με κλασικές τεχνικές ανωνυμοποίησης έχει ως αποτέλεσμα 2 βασικά μειονεκτήματα:
Σας παρουσιάζουμε αυτά τα δύο βασικά μειονεκτήματα, τη χρησιμότητα δεδομένων και την προστασία της ιδιωτικής ζωής. Το κάνουμε με την ακόλουθη εικόνα με εφαρμοσμένη καταστολή και γενίκευση.
Σημείωση: χρησιμοποιούμε εικόνες για επεξηγηματικούς σκοπούς. Η ίδια αρχή ισχύει για δομημένα σύνολα δεδομένων.
Αυτό εισάγει την αντιστάθμιση μεταξύ χρησιμότητας δεδομένων και προστασίας της ιδιωτικής ζωής, όπου οι κλασικές τεχνικές ανωνυμοποίησης προσφέρουν πάντα έναν μη βέλτιστο συνδυασμό και των δύο.
Όχι. Αυτή είναι μια μεγάλη παρανόηση και δεν καταλήγει σε ανώνυμα δεδομένα. Εξακολουθείτε να το εφαρμόζετε ως τρόπο ανωνυμοποίησης του συνόλου δεδομένων σας; Τότε αυτό το ιστολόγιο πρέπει να διαβαστεί για εσάς.
Ο Syntho αναπτύσσει λογισμικό για τη δημιουργία ενός εντελώς νέου συνόλου νέων εγγραφών δεδομένων. Οι πληροφορίες για τον προσδιορισμό πραγματικών ατόμων απλώς δεν υπάρχουν σε ένα συνθετικό σύνολο δεδομένων. Δεδομένου ότι τα συνθετικά δεδομένα περιέχουν τεχνητές εγγραφές δεδομένων που δημιουργούνται από λογισμικό, τα προσωπικά δεδομένα απλά δεν υπάρχουν με αποτέλεσμα μια κατάσταση χωρίς κινδύνους απορρήτου.
Η βασική διαφορά στο Syntho: εφαρμόζουμε μηχανική μάθηση. Κατά συνέπεια, η λύση μας αναπαράγει τη δομή και τις ιδιότητες του αρχικού συνόλου δεδομένων στο συνθετικό σύνολο δεδομένων με αποτέλεσμα τη μεγιστοποίηση της χρησιμότητας δεδομένων. Κατά συνέπεια, θα μπορείτε να λάβετε τα ίδια αποτελέσματα κατά την ανάλυση των συνθετικών δεδομένων σε σύγκριση με τη χρήση των αρχικών δεδομένων.
Αυτή η μελέτη περίπτωσης παρουσιάζει τις καλύτερες στιγμές από την αναφορά ποιότητας που περιέχει διάφορα στατιστικά στοιχεία από συνθετικά δεδομένα που παράγονται μέσω του Syntho Engine σε σύγκριση με τα αρχικά δεδομένα.
Συμπερασματικά, τα συνθετικά δεδομένα είναι η προτιμώμενη λύση για να ξεπεραστεί η τυπική υποβέλτιστη ανταλλαγή μεταξύ χρησιμότητας δεδομένων και προστασίας απορρήτου, που σας προσφέρουν όλες οι κλασικές τεχνικές ανωνυμοποίησης.
Συμπερασματικά, από την άποψη της χρησιμότητας δεδομένων και της προστασίας της ιδιωτικής ζωής, θα πρέπει πάντα να επιλέγετε συνθετικά δεδομένα όταν το επιτρέπει η περίπτωση χρήσης σας.
Αξία για ανάλυση | Κίνδυνος απορρήτου | |
Συνθετικά δεδομένα | Ψηλά | Κανένας |
Πραγματικά (προσωπικά) δεδομένα | Ψηλά | Ψηλά |
Χειρισμένα δεδομένα (μέσω κλασικής «ανωνυμοποίησης») | Χαμηλή-Μεσαία | Medium-High |
Τα συνθετικά δεδομένα του Syntho καλύπτουν τα κενά όπου οι κλασικές τεχνικές ανωνυμοποίησης υπολείπονται μεγιστοποιώντας και τα δύο βοηθητικό πρόγραμμα δεδομένων και προστασία προσωπικών δεδομένων.