Bayanan da ba a san su ba vs bayanan Synthetic

Idan kun ɓoye bayananku kafin yin gwajin bayanan bayanan, akwai abubuwa da yawa a cikin wasa:

  1. A kusan dukkan lokuta, bayanan da ba a san su ba har yanzu ana iya gano su ga daidaikun mutane saboda takamaiman layuka na musamman (misali bayanan likita)
  2. Yayin da kuke ɓoye sunanku ko ba da labari gabaɗaya, ƙarin bayanan da kuke lalatawa. Wannan yana rage ingancin bayanan ku don haka fahimtar ku
  3. Anonymization yana aiki daban don tsarin bayanai daban-daban. Wannan yana nufin ba shi da ƙima kuma yana iya ɗaukar lokaci sosai

Bayanan roba yana warware duk waɗannan gazawar da ƙari. Dubi bidiyon da ke ƙasa don ganin ƙwararrun ƙwararrun ƙididdiga daga SAS (shugaban kasuwa na duniya a cikin nazari) yayi bayani game da kimantawarsa akan bambancin ingancin tsakanin bayanan asali, bayanan da ba a san su ba da kuma ta hanyar Syntho ya samar da bayanan roba.

An ɗauki wannan bidiyon daga Syntho x SAS D[N] A Café game da AI Generated Synthetic Data. Nemo cikakken bidiyon anan.

Edwin van Unen ya aika da saitin bayanai na asali zuwa Syntho kuma mun haɗa bayanan. Amma tambayar kuma ita ce: "Me zai faru idan muka kwatanta bayanan roba zuwa bayanan da ba a san su ba?" Saboda kun yi asarar bayanai da yawa a cikin bayanan da ba a bayyana sunansu ba, shin hakan ma zai faru yayin haɗa ma'aunin bayanai? Mun fara da bayanan bayanai daga masana'antar sadarwa tare da layuka 56.000 da ginshiƙan 128 na bayanan kamfani. Wannan saitin bayanan duka an haɗa su kuma an ɓoye su don haka Edwin zai iya kwatanta haɗawa da saka suna. Daga nan, Edwin ya fara yin samfuri ta amfani da SAS Viya. Ya gina nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan nau'ikan haɓaka da haɓaka da haɓaka da haɓaka da haɓaka da haɓakawa da haɓakar dazuzzuka. Amfani da daidaitattun zaɓuɓɓukan SAS Viya lokacin gina samfuran.

Sa'an nan, lokaci ya yi da za a duba sakamakon. Sakamakon ya kasance mai ban sha'awa sosai don bayanan roba ba don ɓoyewa ba. Ga ƙwararrun ƙwararrun koyo na injina a cikin masu sauraro, muna kallon yankin ƙarƙashin ROC-curve wanda ke faɗi wani abu game da daidaiton ƙirar. Idan aka kwatanta bayanan asali zuwa bayanan da ba a san su ba, mun ga cewa samfurin bayanan asali yana da yanki a ƙarƙashin ROC-curve na .8, wanda yake da kyau sosai, Duk da haka, bayanan da ba a sani ba yana da yanki a ƙarƙashin ROC-curve na .6. Wannan yana nufin mun rasa bayanai da yawa tare da ƙirar da ba a san sunan su ba don haka ku rasa ikon tsinkaya da yawa.

Amma sai, tambayar ita ce menene bayanan synthetics? Anan, mun yi daidai daidai amma maimakon ɓoye bayanan, Syntho ya haɗa bayanan. Yanzu, mun ga duka bayanan asali da bayanan roba suna da yanki a ƙarƙashin ROC-curve na .8, wanda yake kama da haka. Ba daidai ba ne saboda bambancin, amma kama sosai. Wannan yana nufin, yuwuwar bayanan roba yana da matukar alƙawarin - Edwin ya yi farin ciki sosai game da wannan.

kungiyar mutane suna murmushi

Bayanai na roba ne, amma ƙungiyarmu ta gaske ce!

Tuntuɓi Syntho kuma daya daga cikin masananmu zai tuntube ku a cikin saurin haske don bincika darajar bayanan roba!