Sintetik ma'lumotlarimizni SAS ma'lumotlar ekspertlari tomonidan tashqi baholash

Bizning sintetik ma'lumotlarimiz baholandi va tasdiqlangan ma'lumotlar ekspertlari tomonidan SAS

SAS ma'lumotlar ekspertlari tomonidan sintetik ma'lumotlarimizni tashqi baholashga kirish

Biz nima qildik?

Syntho tomonidan yaratilgan sintetik ma'lumotlar SAS ma'lumotlar ekspertlari tomonidan tashqi va ob'ektiv nuqtai nazardan baholanadi, tasdiqlanadi va tasdiqlanadi.

Nima uchun bizning sintetik ma'lumotlarimiz SAS ma'lumotlar ekspertlari tomonidan tashqi baholanadi?

Syntho o'z foydalanuvchilariga ilg'or sifat kafolati hisobotini taqdim etishdan g'ururlansa-da, biz sintetik ma'lumotlarimizni sanoat rahbarlaridan tashqi va ob'ektiv baholash muhimligini ham tushunamiz. Shuning uchun biz sintetik ma'lumotlarimizni baholash uchun analitika bo'yicha yetakchi SAS bilan hamkorlik qilamiz.

SAS asl ma'lumotlarga nisbatan ma'lumotlarning aniqligi, maxfiyligini himoya qilish va Syntho-ning sun'iy intellekt tomonidan yaratilgan sintetik ma'lumotlaridan foydalanishga yaroqliligi bo'yicha turli puxta baholashlarni amalga oshiradi. Xulosa sifatida, SAS Syntho sintetik ma'lumotlarini dastlabki ma'lumotlarga nisbatan aniq, xavfsiz va foydalanishga yaroqli deb baholadi va tasdiqladi.

Ushbu baholash davomida SAS nima qildi?

Maqsadli ma'lumotlar sifatida biz "bo'lib ketish" bashorati uchun foydalaniladigan telekommunikatsiya ma'lumotlaridan foydalandik. Baholashning maqsadi turli xil charchoqni bashorat qilish modellarini o'rgatish va har bir modelning ishlashini baholash uchun sintetik ma'lumotlardan foydalanish edi. Chiqarishni bashorat qilish tasniflash vazifasi bo'lganligi sababli, SAS bashorat qilish uchun mashhur tasniflash modellarini tanladi, jumladan:

  1. Tasodifiy o'rmon
  2. Gradientni kuchaytirish
  3. Logistik regressiya
  4. Neyron tarmoq

Sintetik ma'lumotlarni yaratishdan oldin, SAS tasodifiy ravishda telekommunikatsiya ma'lumotlar to'plamini poezdlar to'plamiga (modellarni o'rgatish uchun) va ushlab turish to'plamiga (modellarni baholash uchun) ajratdi. Baholash uchun alohida kutish to'plamiga ega bo'lish tasniflash modeli yangi ma'lumotlarga qo'llanilganda qanchalik yaxshi ishlashi mumkinligini xolis baholash imkonini beradi.

Poezd to'plamini kirish sifatida ishlatib, Syntho sintetik ma'lumotlar to'plamini yaratish uchun o'zining Syntho dvigatelidan foydalangan. Benchmarking uchun SAS, shuningdek, ma'lum bir chegaraga (k-anonimlik) erishish uchun turli xil anonimlashtirish usullarini qo'llaganidan so'ng, poezdlar to'plamining anonim versiyasini yaratdi. Oldingi qadamlar to'rtta ma'lumotlar to'plamiga olib keldi:

  1. Poyezd ma’lumotlar to‘plami (ya’ni, asl ma’lumotlar to‘plami minus ushlab turish ma’lumotlar to‘plami)
  2. Toʻxtatilgan maʼlumotlar toʻplami (yaʼni asl maʼlumotlar toʻplamining quyi toʻplami)
  3. Anonim ma'lumotlar to'plami (poezd ma'lumotlar to'plamining anonim ma'lumotlari, asl ma'lumotlar to'plami minus ushlab turilgan ma'lumotlar to'plami)
  4. Sintetik ma'lumotlar to'plami (poezd ma'lumotlar to'plamining sintez qilingan ma'lumotlari, asl ma'lumotlar to'plami minus ushlab turilgan ma'lumotlar to'plami)

Har bir tasniflash modelini o'rgatish uchun 1, 3 va 4 ma'lumotlar to'plamidan foydalanildi, natijada 12 (3 x 4) o'qitilgan modellar paydo bo'ldi. Keyinchalik SAS har bir modelning mijozlarning ishlamay qolishini bashorat qilishda aniqligini o'lchash uchun ushlab turish ma'lumotlar to'plamidan foydalangan.

SAS asl ma'lumotlarga nisbatan ma'lumotlarning aniqligi, maxfiyligini himoya qilish va Syntho-ning sun'iy intellekt tomonidan yaratilgan sintetik ma'lumotlaridan foydalanishga yaroqliligi bo'yicha turli puxta baholashlarni amalga oshiradi. Xulosa sifatida, SAS Syntho sintetik ma'lumotlarini dastlabki ma'lumotlarga nisbatan aniq, xavfsiz va foydalanishga yaroqli deb baholadi va tasdiqladi.

Sizda savollar bormi?

Mutaxassislarimizdan biri bilan gaplashing

SAS tomonidan ma'lumotlarni baholashning dastlabki natijalari

Sintetik ma'lumotlar bo'yicha o'qitilgan modellar dastlabki ma'lumotlarga o'rgatilgan modellarga nisbatan juda o'xshash

Syntho-dan olingan sintetik ma'lumotlar nafaqat asosiy naqshlar uchun, balki ilg'or tahliliy vazifalar uchun zarur bo'lgan chuqur "yashirin" statistik naqshlarni ham qamrab oladi. Ikkinchisi shtrixli diagrammada ko'rsatilgan bo'lib, sintetik ma'lumotlarga o'rgatilgan modellarning asl ma'lumotlarga o'rgatilgan modellarga nisbatan aniqligi o'xshashligini ko'rsatadi. Shunday qilib, sintetik ma'lumotlar modellarni haqiqiy o'qitish uchun ishlatilishi mumkin. Asl ma'lumotlarga nisbatan sintetik ma'lumotlarga algoritmlar tomonidan tanlangan kirishlar va o'zgaruvchan ahamiyat juda o'xshash edi. Demak, modellashtirish jarayoni haqiqiy sezgir ma'lumotlardan foydalanishga alternativa sifatida sintetik ma'lumotlarda amalga oshirilishi mumkin degan xulosaga keldi.

Nima uchun anonim ma'lumotlar bo'yicha o'qitilgan modellar yomonroq ball oladi?

Klassik anonimlashtirish usullarining umumiy jihati shundaki, ular shaxslarni qidirishga xalaqit berish uchun asl ma'lumotlarni manipulyatsiya qiladi. Ular ma'lumotlarni manipulyatsiya qiladi va shu bilan jarayonda ma'lumotlarni yo'q qiladi. Qanchalik ko'p anonimlashtirsangiz, ma'lumotlaringiz shunchalik yaxshi himoyalanadi, ammo ma'lumotlaringiz shunchalik ko'p yo'q qilinadi. Bu, ayniqsa, sun'iy intellekt va "bashorat kuchi" muhim bo'lgan modellashtirish vazifalari uchun halokatli, chunki yomon sifatli ma'lumotlar sun'iy intellekt modelidan yomon tushunchalarga olib keladi. SAS buni egri chiziq ostidagi maydon (AUC*) 0.5 ga yaqin bo'lgan holda ko'rsatdi va bu anonim ma'lumotlarga o'rgatilgan modellar eng yomon ishlashini ko'rsatdi.

SAS tomonidan sintetik ma'lumotlarni baholashning qo'shimcha natijalari

SAS tomonidan sintetik ma'lumotlarni baholashning qo'shimcha natijalari

O'zgaruvchilar orasidagi korrelyatsiya va munosabatlar sintetik ma'lumotlarda aniq saqlangan.

Egri chiziq ostidagi maydon (AUC), model ishlashini o'lchash uchun ko'rsatkich barqaror bo'lib qoldi.

Bundan tashqari, sintetik ma'lumotlarni asl ma'lumotlar to'plami bilan solishtirganda modeldagi o'zgaruvchilarning bashorat qilish kuchini ko'rsatadigan o'zgaruvchanlik ahamiyati saqlanib qoldi.

SAS tomonidan va SAS Viya-dan foydalangan holda ushbu kuzatuvlarga asoslanib, biz ishonch bilan xulosa qilishimiz mumkinki, Syntho Engine tomonidan yaratilgan sintetik ma'lumotlar haqiqatan ham sifat jihatidan haqiqiy ma'lumotlar bilan teng. Bu modelni ishlab chiqish uchun sintetik ma'lumotlardan foydalanishni tasdiqlaydi va sintetik ma'lumotlar bilan ilg'or tahlillarga yo'l ochadi.

SAS ma'lumotlar ekspertlarining xulosalari

Sas logotipi

Bizning sintetik ma'lumotlarimiz tasdiqlangan SAS ma'lumotlar ekspertlari tomonidan

Malumot maqolalari

syntho qo'llanma qopqog'i

Sintetik ma'lumotlar qo'llanmasini hozir saqlang!