Апаттық курс синтетикалық деректер


Көбірек білу үшін


бізбен хабарласыңы

кіріспе

Синтетикалық мәліметтер дегеніміз не?

Жауап салыстырмалы түрде қарапайым. Түпнұсқа деректер нақты тұлғалармен (мысалы, клиенттермен, емделушілермен, қызметкерлермен т.б.) барлық өзара әрекеттесулеріңізде және барлық ішкі процестеріңіз арқылы жиналса, синтетикалық деректер компьютерлік алгоритм арқылы жасалады. Бұл компьютерлік алгоритм мүлдем жаңа және жасанды деректер нүктелерін жасайды.

Деректер құпиялылығы мәселелерін шешіңіз

Синтетикалық түрде жасалған деректер бастапқы деректермен бір-біріне қатынасы жоқ мүлдем жаңа және жасанды деректер нүктелерінен тұрады. Демек, синтетикалық деректер нүктелерінің ешқайсысын бастапқы деректерге қайтаруға немесе кері өңдеуге болмайды. Нәтижесінде, синтетикалық деректер GDPR сияқты құпиялылық ережелерінен босатылады және деректердің құпиялылығы мәселелерін шешу және еңсеру үшін шешім ретінде қызмет етеді.

Көбейту және модельдеу

Синтетикалық деректерді генерациялаудың генеративті аспектісі толығымен жаңа деректерді көбейтуге және модельдеуге мүмкіндік береді. Бұл деректер жеткіліксіз болған кезде (деректер тапшылығы), шеткі жағдайларды іріктеу қажет болғанда немесе деректер әлі болмаған кезде шешім ретінде жұмыс істейді.

Мұнда Syntho -ның басты мақсаты - құрылымдық деректер (Excel парақтарында көргеніңіздей, жолдар мен бағандар бар кестелерде пішімделген деректер), бірақ біз әрқашан синтетикалық деректер ұғымын суреттер арқылы суреттеуді ұнатамыз, себебі ол тартымды.

Синтетикалық мәліметтердің түрлері

Синтетикалық деректер қолшатырында синтетикалық деректердің үш түрі бар. Синтетикалық деректердің бұл 3 түрі: жалған деректер, ереже негізінде жасалған синтетикалық деректер және жасанды интеллект (AI) арқылы жасалған синтетикалық деректер. Біз синтетикалық деректердің 3 түрлі түрін қысқаша түсіндіреміз.

Жалған деректер / жалған деректер

Жалған деректер кездейсоқ құрылған деректер (мысалы, жалған деректер генераторы арқылы).

Демек, бастапқы деректердегі сипаттамалар, қатынастар және статистикалық үлгілер жасалған жалған деректерде сақталмайды, түсірілмейді және қайта шығарылмайды. Демек, жалған деректердің/жалған деректердің репрезентативтілігі бастапқы деректермен салыстырғанда минималды.

  • Оны қашан пайдалану керек: тікелей идентификаторларды (PII) ауыстыру үшін немесе деректеріңіз жоқ кезде (әлі) және ережелерді анықтауға уақыт пен күш жұмсағыңыз келмесе.

Ережеге негізделген синтетикалық деректер

Ереже негізінде жасалған синтетикалық деректер - алдын ала анықталған ережелер жинағы арқылы жасалған синтетикалық деректер. Алдын ала анықталған ережелердің мысалдары белгілі бір минималды, ең үлкен мән немесе орташа мәнге ие синтетикалық деректерге ие болғыңыз келуі мүмкін. Ережеге негізделген синтетикалық деректерде қайта шығарғыңыз келетін сипаттамалардың, қатынастардың және статистикалық үлгілердің кез келгені алдын ала анықталуы керек.

Демек, деректер сапасы алдын ала анықталған ережелер жинағы сияқты жақсы болады. Бұл деректердің жоғары сапасы маңызды болған кезде қиындықтарға әкеледі. Біріншіден, синтетикалық деректерде түсірілетін ережелердің шектеулі жиынтығын ғана анықтауға болады. Бұған қоса, бірнеше ережелерді орнату әдетте бір-бірінен қайшы келетін және қайшы келетін ережелерге әкеледі. Сонымен қатар, сіз ешқашан барлық тиісті ережелерді толығымен қамтымайсыз. Сонымен қатар, сіз білмейтін тиісті ережелер болуы мүмкін. Ақырында (және ұмытпау керек), бұл сізге көп уақыт пен энергияны қажет етеді, нәтижесінде тиімді емес шешім болады.

  • Оны қашан пайдалану керек: деректеріңіз болмаған кезде (әлі)

Жасанды интеллект (AI) арқылы жасалған синтетикалық деректер

Атауынан күткендей, жасанды интеллект (AI) арқылы жасалған синтетикалық деректер жасанды интеллект (AI) алгоритмі арқылы жасалған синтетикалық деректер болып табылады. AI моделі барлық сипаттамаларды, қатынастарды және статистикалық заңдылықтарды үйрену үшін бастапқы деректерге үйретіледі. Содан кейін бұл AI алгоритмі мүлде жаңа деректер нүктелерін жасай алады және сол жаңа деректер нүктелерін бастапқы деректер жиынынан сипаттамаларды, қатынастарды және статистикалық үлгілерді шығаратындай етіп үлгілей алады. Мұны біз синтетикалық деректер егізі деп атаймыз.

Жасанды интеллект үлгісі түпнұсқа деректер сияқты пайдаланылуы мүмкін синтетикалық деректер егіздерін жасау үшін түпнұсқа деректерді еліктейді. Бұл AI жасаған синтетикалық деректер бастапқы (сезімтал) деректерді пайдалану үшін балама ретінде пайдаланылуы мүмкін әртүрлі пайдалану жағдайларының құлпын ашады, мысалы, AI жасаған синтетикалық деректерді сынақ деректері, демо деректер немесе аналитика үшін пайдалану.

Синтетикалық деректердің жасалу жолын визуализациялау

Ереже негізінде жасалған синтетикалық деректермен салыстырғанда: сәйкес ережелерді оқып, анықтаудың орнына, AI алгоритмі мұны сіз үшін автоматты түрде жасайды. Мұнда сіз білетін сипаттамалар, қарым-қатынастар және статистикалық үлгілер ғана емес, сонымен қатар сіз білмейтін сипаттамалар, қатынастар және статистикалық үлгілер де қамтылады.

  • Оны қашан пайдалану керек: имитациялау немесе смарт деректерді жасау және кеңейту мүмкіндіктері үшін бастапқы нүкте ретінде пайдалану үшін кіріс ретінде (кейбір) деректер болған кезде

Синтетикалық деректердің қандай түрін пайдалану керек?

Қолдану жағдайыңызға байланысты жалған деректердің/жалған деректердің, ереже негізінде жасалған синтетикалық деректердің немесе жасанды интеллект (AI) арқылы жасалған синтетикалық деректердің комбинациясы ұсынылады. Бұл шолу синтетикалық деректердің қай түрін пайдалану керектігін бірінші нұсқауды қамтамасыз етеді. Syntho олардың барлығын қолдайтындықтан, бізбен пайдалану жағдайын тереңдету үшін сарапшыларымызға хабарласыңыз.

Бұл диаграмма синтетикалық деректердің әртүрлі түрлерін көрсетеді

syntho бағыттауыш қақпағы

Синтетикалық деректер нұсқаулығын қазір сақтаңыз!