FAQ

Sintetik məlumatlar haqqında Tez-tez verilən suallar

Anlaşılır! Xoşbəxtlikdən, cavablarımız var və kömək etmək üçün buradayıq. Tez-tez verilən suallarımızı yoxlayın.

Zəhmət olmasa aşağıdakı sualı açın və daha çox məlumat tapmaq üçün linklərə klikləyin. Burada qeyd olunmayan daha mürəkkəb bir sualınız varmı? Mütəxəssislərimizdən birbaşa soruşun!

Ən çox verilən suallar

Sintetik məlumatlar real dünya mənbələrindən toplanmış deyil, süni şəkildə yaradılan məlumatlara aiddir. Ümumiyyətlə, orijinal məlumatlar insanlarla (müştərilər, xəstələr və s.) bütün qarşılıqlı əlaqələrinizdə və bütün daxili proseslərinizdə toplandığı halda, sintetik məlumatlar kompüter alqoritmi ilə yaradılır.

Sintetik məlumatlar, həmçinin idarə olunan mühitdə modelləri sınaqdan keçirmək və qiymətləndirmək və ya real dünya məlumatlarına bənzər, lakin heç bir həssas məlumatı ehtiva etməyən məlumatlar yaratmaqla həssas məlumatları qorumaq üçün istifadə edilə bilər. Sintetik məlumatlar tez-tez məxfiliyə həssas məlumatlar üçün alternativ kimi istifadə olunur və test məlumatları kimi, analitika və ya maşın öyrənməsi üçün istifadə edilə bilər.

Daha çox oxu

Sintetik məlumatların orijinal məlumatlarla eyni məlumat keyfiyyətinə malik olduğuna zəmanət vermək çətin ola bilər və çox vaxt xüsusi istifadə vəziyyətindən və sintetik məlumatları yaratmaq üçün istifadə olunan üsullardan asılıdır. Generativ modellər kimi sintetik məlumatların yaradılması üçün bəzi üsullar orijinal verilənlərə çox oxşar olan məlumatları istehsal edə bilər. Əsas sual: bunu necə nümayiş etdirmək olar?

Sintetik məlumatların keyfiyyətini təmin etməyin bir neçə yolu var:

  • Məlumat keyfiyyəti hesabatımız vasitəsilə verilənlərin keyfiyyət göstəriciləri: Sintetik verilənlərin orijinal verilənlərlə eyni məlumat keyfiyyətinə malik olmasını təmin etməyin bir yolu, sintetik məlumatları orijinal məlumatlarla müqayisə etmək üçün məlumat keyfiyyəti ölçülərindən istifadə etməkdir. Bu ölçülər verilənlərin oxşarlığı, dəqiqliyi və tamlığı kimi şeyləri ölçmək üçün istifadə edilə bilər. Syntho proqram təminatına müxtəlif məlumat keyfiyyəti ölçüləri ilə məlumat keyfiyyəti hesabatı daxildir.
  • Xarici qiymətləndirmə: orijinal məlumatlarla müqayisədə sintetik məlumatların məlumat keyfiyyəti əsas olduğundan, biz bu yaxınlarda SAS-ın (analitikada bazar lideri) məlumat ekspertləri ilə Syntho tərəfindən real məlumatlarla müqayisədə sintetik məlumatların məlumat keyfiyyətini nümayiş etdirmək üçün qiymətləndirmə apardıq. SAS-dan analitik ekspert Edvin van Unen, müxtəlif analitik (AI) qiymətləndirmələri vasitəsilə Syntho-dan yaradılan sintetik məlumat dəstlərini qiymətləndirdi və nəticələri paylaşdı. Həmin videonun qısa xülasəsinə burada baxın.
  • Özünüz tərəfindən sınaq və qiymətləndirmə: sintetik məlumatlar onu real dünya məlumatları ilə müqayisə etməklə və ya maşın öyrənmə modellərini öyrətmək üçün istifadə etməklə və onların performansını real dünya məlumatları əsasında hazırlanmış modellərlə müqayisə etməklə sınaqdan keçirilə və qiymətləndirilə bilər. Sintetik məlumatların keyfiyyətini niyə özünüz sınamırsınız? Bunun imkanlarını burada mütəxəssislərimizdən soruşun

Qeyd etmək vacibdir ki, sintetik məlumat heç vaxt orijinal məlumatla 100% oxşar olmasına zəmanət verə bilməz, lakin o, konkret istifadə halı üçün faydalı olacaq qədər yaxın ola bilər. Bu xüsusi istifadə nümunəsi hətta qabaqcıl analitika və ya təlim maşın öyrənmə modelləri ola bilər.

Klassik “anonimləşdirmə” həmişə ən yaxşı həll yolu deyil, çünki:

  1. Məxfilik riski - həmişə olacaqsan
    məxfilik riski. Bunları tətbiq etmək
    klassik anonimləşdirmə üsulları
    yalnız çətinləşdirir, amma yox
    şəxsləri müəyyən etmək mümkün deyil.
  2. Məlumatların məhv edilməsi - daha çox sən
    anonimləşdirsəniz, bir o qədər yaxşı qoruyursunuz
    məxfiliyiniz, amma daha çox siz
    məlumatlarınızı məhv edin. Bu nə deyil
    siz analitika istəyirsiniz, çünki
    məhv edilmiş məlumatlar pis nəticələnəcək
    anlayışlar.
  3. Vaxt sərf edir - bu bir həll yoludur
    bu çox vaxt aparır, çünki
    bu texnikalar fərqli işləyir
    verilənlər bazası və verilənlər növü üzrə.

Sintetik məlumatlar bütün bu çatışmazlıqları həll etmək məqsədi daşıyır. Fərq o qədər təəccüblüdür ki, bu barədə video hazırladıq. Bura baxın.

Tez-tez soruşulan suallar

Sintetik məlumatlar

Ümumiyyətlə, müştərilərimizin əksəriyyəti sintetik məlumatlardan aşağıdakılar üçün istifadə edir:

  • Proqram təminatının sınaqdan keçirilməsi və inkişafı
  • Analitika, model inkişafı və qabaqcıl analitika üçün sintetik məlumatlar (AI & ML)
  • Məhsul demoları

Daha çox oxuyun və istifadə hallarını araşdırın.

Sintetik məlumat əkizləri real dünya verilənlər toplusunun və/yaxud verilənlər bazasının alqoritm tərəfindən yaradılan replikasıdır. Synthetic Data Twin ilə Syntho, orijinalın real təsvirini yaratmaq üçün orijinal verilənlər toplusunu və ya verilənlər bazasını orijinal məlumatlara mümkün qədər yaxın təqlid etməyi hədəfləyir. Sintetik məlumat ikizi ilə biz orijinal məlumatlarla müqayisədə daha yüksək sintetik məlumat keyfiyyətini hədəfləyirik. Biz bunu ən müasir süni intellekt modellərindən istifadə edən sintetik məlumat proqram təminatımızla edirik. Həmin süni intellekt modelləri tamamilə yeni məlumat nöqtələri yaradır və onları elə modelləşdirir ki, biz orijinal məlumatların xüsusiyyətlərini, əlaqələrini və statistik nümunələrini elə qoruyuruq ki, siz ondan orijinal məlumat kimi istifadə edə biləsiniz.

Bu, maşın öyrənmə modellərinin sınaqdan keçirilməsi və öyrədilməsi, tədqiqat və inkişaf üçün ssenarilərin simulyasiyası və təlim və təhsil üçün virtual mühitlərin yaradılması kimi müxtəlif məqsədlər üçün istifadə edilə bilər. Sintetik məlumat əkizləri, mövcud olmadıqda və ya ciddi məlumat məxfiliyi qaydalarına görə real dünya məlumatlarından istifadə qeyri-praktik və ya qeyri-etik olduqda real dünya məlumatlarının yerinə istifadə oluna bilən real və nümayəndəli məlumatlar yaratmaq üçün istifadə edilə bilər.

Daha ətraflı.

Bəli, biz etdik. Biz məlumatlarınızı növbəti səviyyəyə qaldırmaq üçün lağ edənlər də daxil olmaqla, əlavə dəyər yaradan müxtəlif sintetik məlumatların optimallaşdırılması və artırılması xüsusiyyətləri təklif edirik.

Daha ətraflı.

Sınaq məlumatlar və süni intellekt tərəfindən yaradılan sintetik məlumatlar hər iki sintetik məlumat növüdür, lakin onlar müxtəlif yollarla yaradılır və müxtəlif məqsədlərə xidmət edir.

Sınaq məlumatlar əl ilə yaradılan və tez-tez sınaq və inkişaf məqsədləri üçün istifadə edilən sintetik məlumat növüdür. O, adətən idarə olunan mühitdə real dünya məlumatlarının davranışını simulyasiya etmək üçün istifadə olunur və tez-tez sistemin və ya tətbiqin funksionallığını yoxlamaq üçün istifadə olunur. Çox vaxt sadədir, yaratmaq asandır və mürəkkəb modellər və ya alqoritmlər tələb etmir. Çox vaxt bir istinad məlumatları "saxta məlumat" və ya "saxta məlumat" kimi ələ salır.

Süni intellekt tərəfindən yaradılan sintetik məlumatlar isə maşın öyrənməsi və ya generativ modellər kimi süni intellekt üsullarından istifadə etməklə yaradılır. Ciddi məxfilik qaydalarına görə real dünya məlumatlarından istifadə qeyri-praktik və ya qeyri-etik olarkən real dünya məlumatlarının yerinə istifadə edilə bilən real və təmsilçi məlumatlar yaratmaq üçün istifadə olunur. O, tez-tez daha mürəkkəbdir və əl ilə verilən saxta məlumatlardan daha çox hesablama resursları tələb edir. Nəticədə, o, daha realistdir və orijinal məlumatları mümkün qədər yaxınlaşdırır.

Xülasə, saxta məlumatlar əl ilə yaradılır və adətən sınaq və inkişaf üçün istifadə olunur, süni intellekt tərəfindən yaradılan sintetik məlumatlar isə süni intellekt üsullarından istifadə etməklə yaradılır və təmsilçi və real məlumatlar yaratmaq üçün istifadə olunur.

Daha çox sual? Mütəxəssislərimizdən soruşun

Data keyfiyyəti

Sintetik məlumatların orijinal məlumatlarla eyni məlumat keyfiyyətinə malik olduğuna zəmanət vermək çətin ola bilər və çox vaxt xüsusi istifadə vəziyyətindən və sintetik məlumatları yaratmaq üçün istifadə olunan üsullardan asılıdır. Generativ modellər kimi sintetik məlumatların yaradılması üçün bəzi üsullar orijinal verilənlərə çox oxşar olan məlumatları istehsal edə bilər. Əsas sual: bunu necə nümayiş etdirmək olar?

Sintetik məlumatların keyfiyyətini təmin etməyin bir neçə yolu var:

  • Məlumat keyfiyyəti hesabatımız vasitəsilə verilənlərin keyfiyyət göstəriciləri: Sintetik verilənlərin orijinal verilənlərlə eyni məlumat keyfiyyətinə malik olmasını təmin etməyin bir yolu, sintetik məlumatları orijinal məlumatlarla müqayisə etmək üçün məlumat keyfiyyəti ölçülərindən istifadə etməkdir. Bu ölçülər verilənlərin oxşarlığı, dəqiqliyi və tamlığı kimi şeyləri ölçmək üçün istifadə edilə bilər. Syntho proqram təminatına müxtəlif məlumat keyfiyyəti ölçüləri ilə məlumat keyfiyyəti hesabatı daxildir.
  • Xarici qiymətləndirmə: orijinal məlumatlarla müqayisədə sintetik məlumatların məlumat keyfiyyəti əsas olduğundan, biz bu yaxınlarda SAS-ın (analitikada bazar lideri) məlumat ekspertləri ilə Syntho tərəfindən real məlumatlarla müqayisədə sintetik məlumatların məlumat keyfiyyətini nümayiş etdirmək üçün qiymətləndirmə apardıq. SAS-dan analitik ekspert Edvin van Unen, müxtəlif analitik (AI) qiymətləndirmələri vasitəsilə Syntho-dan yaradılan sintetik məlumat dəstlərini qiymətləndirdi və nəticələri paylaşdı. Həmin videonun qısa xülasəsinə burada baxın.
  • Özünüz tərəfindən sınaq və qiymətləndirmə: sintetik məlumatlar onu real dünya məlumatları ilə müqayisə etməklə və ya maşın öyrənmə modellərini öyrətmək üçün istifadə etməklə və onların performansını real dünya məlumatları əsasında hazırlanmış modellərlə müqayisə etməklə sınaqdan keçirilə və qiymətləndirilə bilər. Sintetik məlumatların keyfiyyətini niyə özünüz sınamırsınız? Bunun imkanlarını burada mütəxəssislərimizdən soruşun

Qeyd etmək vacibdir ki, sintetik məlumat heç vaxt orijinal məlumatla 100% oxşar olmasına zəmanət verə bilməz, lakin o, konkret istifadə halı üçün faydalı olacaq qədər yaxın ola bilər. Bu xüsusi istifadə nümunəsi hətta qabaqcıl analitika və ya təlim maşın öyrənmə modelləri ola bilər.

Bəli, elədir. Sintetik məlumatlar hətta ilkin məlumatda mövcud olduğunu bilmədiyiniz nümunələri ehtiva edir.

Ancaq bunun üçün sadəcə sözümüzü qəbul etməyin. SAS-ın (analitika üzrə qlobal bazar lideri) analitik ekspertləri bizim sintetik məlumatlarımızı (AI) qiymətləndirdilər və onu orijinal məlumatlarla müqayisə etdilər. Maraqlıdır? izləyin bütün hadisə burada və ya haqqında qısa versiyaya baxın burada məlumat keyfiyyəti.

Bəli, biz etdik. Platformamız verilənlər bazası və nəticədə məlumat bazasında verilənlər bazası arasında istinad bütövlüyünün qorunması üçün optimallaşdırılmışdır.

Bu barədə daha çox məlumat əldə etmək istəyirsiniz?

Mütəxəssislərimizdən birbaşa soruşun.

Məxfilik

Xeyr, etmirik. Syntho Mühərrikini docker vasitəsilə asanlıqla yerli və ya şəxsi buludunuzda yerləşdirə bilərik.

Xeyr. Biz platformamızı müştərinin etibarlı mühitində asanlıqla tətbiq oluna biləcək şəkildə optimallaşdırdıq. Bu, məlumatların heç vaxt müştərinin etibarlı mühitini tərk etməyəcəyini təmin edir. Müştərinin etibarlı mühiti üçün yerləşdirmə variantları “yerdə” və “müştərinin bulud mühitində (şəxsi bulud)”dur.

Könüllü: Syntho "Syntho buludunda" yerləşdirilən versiyanı dəstəkləyir.

Xeyr. Syntho Mühərriki özünəxidmət platformasıdır. Nəticədə, Syntho Mühərriki ilə sintetik məlumatların yaradılması elə bir şəkildə mümkündür ki end-to-end proses, Syntho heç vaxt görə bilmir və heç vaxt məlumatları emal etmək tələb olunmur.

Bəli, biz bunu QA hesabatımız vasitəsilə edirik.

 

Verilənlər toplusunu sintez edərkən, fərdləri yenidən müəyyən edə bilmədiyini nümayiş etdirmək vacibdir. In bu video, Marijn bunu nümayiş etdirmək üçün keyfiyyət hesabatımızda olan məxfilik tədbirlərini təqdim edir.

Synthonun QA hesabatı üçdən ibarətdir sənaye standartı məlumat məxfiliyini qiymətləndirmək üçün ölçülər. Bu ölçülərin hər birinin arxasında duran fikir aşağıdakı kimidir:

  • Sintetik məlumat (S) hədəf məlumatlara “mümkün qədər yaxın” olmalıdır, lakin “çox yaxın olmamalıdır” (T).
  • Təsadüfi seçilmiş saxlama datası (H) “çox yaxın” üçün etalon müəyyən edir.
  • A mükəmməl həll orijinal məlumatlar kimi davranan, lakin əvvəllər görünməmiş yeni sintetik məlumatlar yaradır (= H).

Hollandiya Məlumat Mühafizəsi Təşkilatı tərəfindən xüsusi olaraq vurğulanan istifadə hallarından biri sintetik məlumatların sınaq məlumatları kimi istifadə edilməsidir.

Daha çoxunu bu məqalədə tapa bilərsiniz.

Syntho Mühərriki

Syntho Mühərriki Docker konteynerində göndərilir və asanlıqla yerləşdirilə və seçdiyiniz mühitə qoşula bilər.

Mümkün yerləşdirmə seçimlərinə aşağıdakılar daxildir:

  • Yerdə olanlar
  • İstənilən (özəl) bulud
  • İstənilən başqa mühit

Daha çox oxu.

Syntho sizə verilənlər bazalarınız, proqramlarınız, məlumat kəmərləri və ya fayl sistemlərinizlə asanlıqla əlaqə yaratmağa imkan verir. 

Biz müxtəlif inteqrasiya edilmiş konnektorları dəstəkləyirik ki, siz mənbə mühiti (orijinal məlumatın saxlandığı yer) və təyinat mühiti (sintetik məlumatlarınızı yazmaq istədiyiniz yer) ilə əlaqə saxlaya biləsiniz. end-to-end inteqrasiya olunmuş yanaşma.

Dəstəklədiyimiz əlaqə xüsusiyyətləri:

  • Docker ilə birləşdirin və oynayın
  • 20+ verilənlər bazası bağlayıcıları
  • 20+ fayl sistemi konnektoru

Daha çox oxu.

Təbii ki, generasiya vaxtı verilənlər bazasının ölçüsündən asılıdır. Orta hesabla 1 milyondan az qeydi olan cədvəl 5 dəqiqədən az müddətdə sintez olunur.

Syntho-nun maşın öyrənmə alqoritmləri daha çox obyekt qeydləri ilə xüsusiyyətləri daha yaxşı ümumiləşdirə bilər ki, bu da məxfilik riskini azaldır. Minimum sütun-sətir nisbəti 1:500 tövsiyə olunur. Məsələn, mənbə cədvəlinizdə 6 sütun varsa, o, minimum 3000 sətirdən ibarət olmalıdır.

Dəyməz. Sintetik məlumatların üstünlüklərini, işini və istifadə hallarını tam başa düşmək üçün müəyyən səy tələb olunsa da, sintez prosesi çox sadədir və əsas kompüter biliyi olan hər kəs bunu edə bilər. Sintez prosesi haqqında daha çox məlumat üçün baxın Bu səhifə or bir demoq isteyin.

Syntho Mühərriki strukturlaşdırılmış, cədvəl məlumatlarında (sətir və sütunlardan ibarət hər hansı bir şey) ən yaxşı işləyir. Bu strukturlar çərçivəsində biz aşağıdakı məlumat növlərini dəstəkləyirik:

  • Cədvəllərdə formatlaşdırılmış struktur verilənləri (kateqorik, ədədi və s.)
  • Birbaşa identifikatorlar və PII
  • Böyük verilənlər bazası və verilənlər bazası
  • Coğrafi yer məlumatları (məsələn, GPS)
  • Zaman seriyası məlumatları
  • Çox cədvəlli verilənlər bazası (istinad tamlığı ilə)
  • Mətn məlumatlarını açın

 

Kompleks məlumat dəstəyi
Bütün müntəzəm cədvəl məlumat növlərinin yanında Syntho Mühərriki mürəkkəb məlumat növlərini və mürəkkəb məlumat strukturlarını dəstəkləyir.

  • Vaxt seriyası
  • Çox cədvəlli verilənlər bazası
  • Açıq mətn

Daha çox oxu.

Xeyr, biz məlumatların dəqiqliyindən ödün vermədən hesablama tələblərini minimuma endirmək üçün platformamızı optimallaşdırdıq (məsələn, GPU tələb olunmur). Bundan əlavə, biz böyük verilənlər bazalarını sintez edə bilməsi üçün avtomatik miqyaslaşdırmanı dəstəkləyirik.

Bəli. Syntho proqramı çoxsaylı cədvəlləri ehtiva edən verilənlər bazası üçün optimallaşdırılmışdır.

Buna gəldikdə, Syntho məlumatların dəqiqliyini artırmaq üçün məlumat növlərini, sxemləri və formatları avtomatik olaraq aşkar edir. Çox cədvəlli verilənlər bazası üçün biz istinad bütövlüyünü qorumaq üçün avtomatik cədvəl əlaqəsi nəticələrini və sintezini dəstəkləyirik.

gülümsəyən bir qrup insan

Məlumat sintetikdir, lakin komandamız realdır!

Syntho ilə əlaqə saxlayın və mütəxəssislərimizdən biri sintetik məlumatların dəyərini öyrənmək üçün işıq sürətində sizinlə əlaqə saxlayacaq!