Από το απόρρητο στη δυνατότητα: Χρήση Synthetic Data μέσω του ενσωματωμένου Syntho Engine στο SAS Viya ως μέρος του SAS Hackathon για ξεκλείδωμα ευαίσθητων δεδομένων απορρήτου

Ξεκλειδώνουμε το πλήρες δυναμικό των δεδομένων υγειονομικής περίθαλψης με τη γενετική τεχνητή νοημοσύνη κατά τη διάρκεια του SAS Hackathon.

Γιατί να ξεκλειδώσετε δεδομένα υγειονομικής περίθαλψης ευαίσθητα στο απόρρητο;

Η υγειονομική περίθαλψη χρειάζεται σοβαρά πληροφορίες για τη μονάδα δεδομένων. Επειδή η υγειονομική περίθαλψη είναι υποστελεχωμένη, υπερβολικά πιεσμένη με τη δυνατότητα να σώσει ζωές. Ωστόσο, τα δεδομένα υγειονομικής περίθαλψης είναι τα πιο ευαίσθητα δεδομένα απορρήτου και επομένως είναι κλειδωμένα. Αυτά τα ευαίσθητα δεδομένα απορρήτου:

  • Είναι χρονοβόρα η πρόσβαση
  • Απαιτεί εκτεταμένη γραφειοκρατία
  • Και δεν μπορεί απλά να χρησιμοποιηθεί

Αυτό είναι προβληματικό, καθώς στόχος μας για αυτό το hackathon είναι η πρόβλεψη της επιδείνωσης και της θνησιμότητας ως μέρος της έρευνας για τον καρκίνο για ένα κορυφαίο νοσοκομείο. Αυτός είναι ο λόγος για τον οποίο η Syntho και η SAS συνεργάζονται για αυτό το νοσοκομείο, όπου η Syntho ξεκλειδώνει δεδομένα με συνθετικά δεδομένα και η SAS πραγματοποιεί πληροφορίες δεδομένων με τη SAS Viya, την κορυφαία πλατφόρμα ανάλυσης.

Συνθετικά δεδομένα;

Το Syntho Engine μας δημιουργεί εντελώς νέα τεχνητά δημιουργημένα δεδομένα. Βασική διαφορά, εφαρμόζουμε την τεχνητή νοημοσύνη για να μιμούμε τα χαρακτηριστικά των δεδομένων του πραγματικού κόσμου στα συνθετικά δεδομένα και σε τέτοιο βαθμό που μπορεί να χρησιμοποιηθεί ακόμη και για αναλύσεις. Γι' αυτό το ονομάζουμε συνθετικό δίδυμο δεδομένων. Είναι τόσο καλό όσο πραγματικό και στατιστικά ταυτόσημο με τα αρχικά δεδομένα, αλλά χωρίς κινδύνους για την προστασία της ιδιωτικής ζωής.

Syntho Engine ενσωματωμένος στο SAS Viya

Κατά τη διάρκεια αυτού του hackathon, ενσωματώσαμε το Syntho Engine API στο SAS Viya ως βήμα. Εδώ επιβεβαιώσαμε επίσης ότι τα συνθετικά δεδομένα είναι όντως τόσο καλά όσο πραγματικά στο SAS Viya. Πριν ξεκινήσουμε με την έρευνα για τον καρκίνο, δοκιμάσαμε αυτήν την ολοκληρωμένη προσέγγιση με ένα ανοιχτό σύνολο δεδομένων και επικυρώσαμε εάν τα συνθετικά δεδομένα είναι όντως τόσο καλά όσο πραγματικά, μέσω διαφόρων μεθόδων επικύρωσης στο SAS Viya.

Είναι τα συνθετικά δεδομένα τόσο καλά όσο πραγματικά;

Οι συσχετίσεις, οι σχέσεις μεταξύ των μεταβλητών, διατηρούνται.

Η περιοχή κάτω από την καμπύλη, ένα μέτρο για την απόδοση του μοντέλου, διατηρείται.

Και ακόμη και η σημασία της μεταβλητής, η προγνωστική ισχύς των μεταβλητών για ένα μοντέλο, ισχύει όταν συγκρίνουμε τα αρχικά δεδομένα με τα συνθετικά δεδομένα.

Ως εκ τούτου, μπορούμε να συμπεράνουμε ότι τα συνθετικά δεδομένα που δημιουργούνται από το Syntho Engine στο SAS Viya είναι πράγματι τόσο καλά όσο και πραγματικά και ότι μπορούμε να χρησιμοποιήσουμε συνθετικά δεδομένα για την ανάπτυξη μοντέλων. Ως εκ τούτου, μπορούμε να ξεκινήσουμε με αυτήν την έρευνα για τον καρκίνο για να προβλέψουμε την επιδείνωση και τη θνησιμότητα.

Συνθετικά δεδομένα για την Έρευνα Καρκίνου για κορυφαίο νοσοκομείο

Εδώ, χρησιμοποιήσαμε το ενσωματωμένο Syntho Engine ως βήμα στο SAS Viya για να ξεκλειδώσετε αυτά τα ευαίσθητα δεδομένα απορρήτου με συνθετικά δεδομένα.

Το αποτέλεσμα, μια AUC 0.74 και ένα μοντέλο που είναι σε θέση να προβλέψει την επιδείνωση και τη θνησιμότητα.

Ως αποτέλεσμα της χρήσης συνθετικών δεδομένων, μπορέσαμε να ξεκλειδώσουμε αυτήν την υγειονομική περίθαλψη σε μια κατάσταση με λιγότερους κινδύνους, περισσότερα δεδομένα και ταχύτερη πρόσβαση σε δεδομένα.

Συνδυάστε δεδομένα από πολλά νοσοκομεία

Αυτό δεν είναι δυνατό μόνο εντός του νοσοκομείου, αλλά θα μπορούσαν επίσης να συνδυαστούν δεδομένα από πολλά νοσοκομεία. Ως εκ τούτου, το επόμενο βήμα ήταν η σύνθεση δεδομένων από πολλά νοσοκομεία. Διαφορετικά σχετικά νοσοκομειακά δεδομένα συντέθηκαν ως είσοδοι για το μοντέλο στο SAS Viya μέσω του Syntho Engine. Εδώ, συνειδητοποιήσαμε μια AUC 0.78, αποδεικνύοντας ότι περισσότερα δεδομένα οδηγούν σε καλύτερη προγνωστική ισχύ αυτών των μοντέλων.

Αποτελέσματα

Και αυτά είναι τα αποτελέσματα από αυτό το hackathon:

  • Το Syntho είναι ενσωματωμένο στο SAS Viya ως βήμα
  • Τα συνθετικά δεδομένα δημιουργούνται με επιτυχία μέσω του Syntho στο SAS Viya
  • Η ακρίβεια των συνθετικών δεδομένων είναι εγκεκριμένη, καθώς τα μοντέλα που έχουν εκπαιδευτεί σε συνθετικά δεδομένα βαθμολογούνται παρόμοια με τα μοντέλα που έχουν εκπαιδευτεί σε πρωτότυπα δεδομένα
  • προβλέψαμε επιδείνωση και θνησιμότητα σε συνθετικά δεδομένα ως μέρος της έρευνας για τον καρκίνο
  • και έδειξε αύξηση στην AUC όταν συνδυάζονται συνθετικά δεδομένα από πολλά νοσοκομεία.

Τα επόμενα βήματα

Τα επόμενα βήματα είναι να

  • περιλαμβάνει περισσότερα νοσοκομεία
  • να επεκτείνει τις περιπτώσεις χρήσης και
  • να επεκταθεί και σε οποιονδήποτε άλλο οργανισμό, καθώς οι τεχνικές είναι αγνωστικιστών τομέα.

Αυτός είναι ο τρόπος με τον οποίο η Syntho και η SAS ξεκλειδώνουν δεδομένα και πραγματοποιούν γνώσεις που βασίζονται σε δεδομένα στην υγειονομική περίθαλψη για να διασφαλίσουν ότι η υγειονομική περίθαλψη είναι καλά στελεχωμένη, με κανονική πίεση για να σωθούν ζωές.

Κάλυψη Synthetic Data in Healthcare

Αποθηκεύστε τα συνθετικά σας δεδομένα στην αναφορά υγειονομικής περίθαλψης!