FAQ

Awọn ibeere Nigbagbogbo nipa data sintetiki

Oye! Ni Oriire, a ni awọn idahun ati pe a wa nibi lati ṣe iranlọwọ. Ṣayẹwo awọn ibeere wa nigbagbogbo.

Jọwọ ṣii ibeere kan ni isalẹ ki o tẹ awọn ọna asopọ lati wa alaye diẹ sii. Ni ibeere idiju diẹ sii ti a ko sọ nibi? Beere awọn amoye wa taara!

Awọn julọ beere ibeere

Awọn data sintetiki n tọka si data ti o jẹ ipilẹṣẹ atọwọda dipo gbigba lati awọn orisun gidi-aye. Ni gbogbogbo, lakoko ti a gba data atilẹba ni gbogbo awọn ibaraẹnisọrọ rẹ pẹlu eniyan (awọn alabara, awọn alaisan, ati bẹbẹ lọ) ati nipasẹ gbogbo awọn ilana inu rẹ, data sintetiki jẹ ipilẹṣẹ nipasẹ algorithm kọnputa kan.

Awọn data sintetiki tun le ṣee lo lati ṣe idanwo ati ṣe iṣiro awọn awoṣe ni agbegbe iṣakoso, tabi lati daabobo alaye ifura nipa ṣiṣẹda data ti o jọra si data gidi-aye ṣugbọn ko ni alaye ifura eyikeyi ninu. Awọn data sintetiki ni igbagbogbo lo bi yiyan fun data ifarabalẹ ikọkọ ati pe o le ṣee lo bi data idanwo, fun itupalẹ tabi lati kọ ẹkọ ẹrọ.

Ka siwaju

Iṣeduro pe data sintetiki di didara data kanna bi data atilẹba le jẹ nija, ati nigbagbogbo da lori ọran lilo kan pato ati awọn ọna ti a lo lati ṣe ipilẹṣẹ data sintetiki naa. Diẹ ninu awọn ọna fun ṣiṣẹda data sintetiki, gẹgẹbi awọn awoṣe ipilẹṣẹ, le ṣe agbejade data ti o jọra pupọ si data atilẹba. Ibeere pataki: bawo ni lati ṣe afihan eyi?

Awọn ọna diẹ wa lati rii daju didara data sintetiki:

  • Awọn metiriki didara data nipasẹ ijabọ didara data wa: Ọna kan lati rii daju pe data sintetiki di didara data kanna bi data atilẹba ni lati lo awọn metiriki didara data lati ṣe afiwe data sintetiki si data atilẹba. Awọn metiriki wọnyi le ṣee lo lati wiwọn awọn nkan bii ibajọra, deede, ati pipe ti data naa. Sọfitiwia Syntho pẹlu ijabọ didara data pẹlu ọpọlọpọ awọn metiriki didara data.
  • Ita imọ: niwon didara data ti data sintetiki ni akawe si data atilẹba jẹ bọtini, a ṣe ayẹwo laipe pẹlu awọn amoye data ti SAS (olori ọja ni awọn atupale) lati ṣe afihan didara data ti data sintetiki nipasẹ Syntho ni afiwe si data gidi. Edwin van Unen, onimọran atupale lati SAS, ṣe iṣiro awọn ipilẹ data sintetiki ti ipilẹṣẹ lati Syntho nipasẹ ọpọlọpọ awọn igbelewọn atupale (AI) ati pin awọn abajade. Wo fidio kukuru kukuru kan nibi.
  • Idanwo ati igbelewọn nipasẹ ara rẹ: Awọn data sintetiki le ṣe idanwo ati ṣe ayẹwo nipa fifiwewe si data gidi-aye tabi nipa lilo rẹ lati kọ awọn awoṣe ikẹkọ ẹrọ ati fiwera iṣẹ wọn si awọn awoṣe ti oṣiṣẹ lori data gidi-aye. Kilode ti o ko ṣe idanwo didara data ti data sintetiki nipasẹ ararẹ? Beere awọn amoye wa fun awọn aye ti eyi nibi

O ṣe pataki lati ṣe akiyesi pe data sintetiki ko le ṣe iṣeduro lati jẹ 100% iru si data atilẹba, ṣugbọn o le sunmọ to lati wulo fun ọran lilo kan pato. Ẹran lilo pato le paapaa jẹ awọn atupale ilọsiwaju tabi awọn awoṣe ikẹkọ ẹrọ ikẹkọ.

Classic 'anonymization' kii ṣe nigbagbogbo ojutu ti o dara julọ, nitori:

  1. Ewu asiri – o yoo nigbagbogbo ni
    a ìpamọ ewu. Lilo awon
    awọn imuposi ailorukọ Ayebaye
    mu ki o le nikan, sugbon ko
    ko ṣee ṣe lati ṣe idanimọ awọn ẹni-kọọkan.
  2. Iparun data - diẹ sii o
    anonymize, awọn dara ti o dabobo
    asiri rẹ, ṣugbọn awọn diẹ ti o
    run data rẹ. Eyi kii ṣe kini
    o fẹ fun atupale, nitori
    data run yoo ja si ni buburu
    awọn imọran.
  3. Akoko ilo – O jẹ ojutu kan
    ti o gba a pupo ti akoko, nitori
    awon imuposi ṣiṣẹ o yatọ si
    fun dataset ati fun datatype.

Awọn data sintetiki ni ero lati yanju gbogbo awọn ailagbara wọnyi. Iyatọ naa jẹ iyalẹnu pupọ pe a ṣe fidio kan nipa rẹ. Wo o nibi.

Nigbagbogbo bi Ìbéèrè

Data Sintetiki

Ni gbogbogbo, pupọ julọ awọn alabara wa lo data sintetiki fun:

  • Idanwo software & idagbasoke
  • Awọn data sintetiki fun awọn atupale, idagbasoke awoṣe ati awọn itupalẹ ilọsiwaju (AI & ML)
  • Ọja demos

Ka siwaju ati ṣawari awọn ọran lilo.

Ibeji data sintetiki jẹ ẹda algoridimu ti ipilẹṣẹ ti data ipilẹ-aye gidi ati / tabi data data. Pẹlu Data Twin Sintetiki kan, Syntho ṣe ifọkansi lati ṣafarawe ipilẹ data atilẹba tabi data data bi o ti ṣee ṣe si data atilẹba lati ṣẹda aṣoju ojulowo ti atilẹba. Pẹlu ibeji data sintetiki, a ṣe ifọkansi fun didara data sintetiki ti o ga julọ ni lafiwe si data atilẹba. A ṣe eyi pẹlu sọfitiwia data sintetiki ti o nlo awọn awoṣe AI-ti-ti-aworan. Awọn awoṣe AI wọnyẹn ṣe agbekalẹ awọn aaye data tuntun patapata ati awoṣe wọn ni ọna ti a tọju awọn abuda, awọn ibatan ati awọn ilana iṣiro ti data atilẹba si iru iwọn ti o le lo bi-ti o ba jẹ data atilẹba.

Eyi le ṣee lo fun awọn idi oriṣiriṣi, gẹgẹbi idanwo ati awọn awoṣe ikẹkọ ẹrọ ikẹkọ, simulating awọn oju iṣẹlẹ fun iwadii ati idagbasoke, ati ṣiṣẹda awọn agbegbe foju fun ikẹkọ ati eto-ẹkọ. Awọn ibeji data sintetiki le ṣee lo lati ṣẹda ojulowo ati data aṣoju ti o le ṣee lo ni aaye data gidi-aye nigba ti ko ba wa tabi nigba lilo data gidi-aye yoo jẹ aiṣedeede tabi aiṣedeede nitori awọn ilana ipamọ data to muna.

Ka siwaju.

Bẹẹni a ṣe. A nfunni ni ọpọlọpọ iye-fikun data iṣapeye sintetiki ati awọn ẹya imudara, pẹlu awọn ẹlẹgàn, lati mu data rẹ lọ si ipele atẹle.

Ka siwaju.

Mock data ati AI-ti ipilẹṣẹ data sintetiki jẹ mejeeji orisi ti sintetiki data, sugbon ti won ti wa ni ti ipilẹṣẹ ni orisirisi awọn ọna ati ki o sin o yatọ si idi.

Data Mock jẹ iru data sintetiki ti o ṣẹda pẹlu ọwọ ati nigbagbogbo lo fun idanwo ati awọn idi idagbasoke. O jẹ igbagbogbo lo lati ṣe afiwe ihuwasi ti data gidi-aye ni agbegbe iṣakoso ati nigbagbogbo lo lati ṣe idanwo iṣẹ ṣiṣe ti eto tabi ohun elo kan. Nigbagbogbo o rọrun, rọrun lati ṣe ipilẹṣẹ, ati pe ko nilo awọn awoṣe eka tabi awọn algoridimu. Nigbagbogbo, awọn olutọka kan tun lati ṣe ẹlẹyà data bi “data dimmy” tabi “data iro”.

Awọn data sintetiki ti AI ti ipilẹṣẹ, ni ida keji, jẹ ipilẹṣẹ nipa lilo awọn ilana itetisi atọwọda, gẹgẹbi ikẹkọ ẹrọ tabi awọn awoṣe ipilẹṣẹ. O ti wa ni lilo lati ṣẹda ojulowo ati data aṣoju ti o le ṣee lo ni aaye data gidi-aye nigba lilo data gidi-aye yoo jẹ aiṣedeede tabi aiṣedeede nitori awọn ilana ikọkọ ti o muna. Nigbagbogbo o jẹ eka sii ati pe o nilo awọn orisun iṣiro diẹ sii ju data ẹgan afọwọṣe. Bi abajade, o jẹ ojulowo diẹ sii ati ki o farawe data atilẹba ni isunmọ bi o ti ṣee.

Ni akojọpọ, data ẹgan ni a ṣẹda pẹlu ọwọ ati pe a lo nigbagbogbo fun idanwo ati idagbasoke, lakoko ti data sintetiki ti ipilẹṣẹ AI ti ṣẹda nipa lilo awọn imuposi oye atọwọda ati pe a lo lati ṣẹda aṣoju ati data ojulowo.

Awọn ibeere diẹ sii? Beere awọn amoye wa

Didara Didara

Iṣeduro pe data sintetiki di didara data kanna bi data atilẹba le jẹ nija, ati nigbagbogbo da lori ọran lilo kan pato ati awọn ọna ti a lo lati ṣe ipilẹṣẹ data sintetiki naa. Diẹ ninu awọn ọna fun ṣiṣẹda data sintetiki, gẹgẹbi awọn awoṣe ipilẹṣẹ, le ṣe agbejade data ti o jọra pupọ si data atilẹba. Ibeere pataki: bawo ni lati ṣe afihan eyi?

Awọn ọna diẹ wa lati rii daju didara data sintetiki:

  • Awọn metiriki didara data nipasẹ ijabọ didara data wa: Ọna kan lati rii daju pe data sintetiki di didara data kanna bi data atilẹba ni lati lo awọn metiriki didara data lati ṣe afiwe data sintetiki si data atilẹba. Awọn metiriki wọnyi le ṣee lo lati wiwọn awọn nkan bii ibajọra, deede, ati pipe ti data naa. Sọfitiwia Syntho pẹlu ijabọ didara data pẹlu ọpọlọpọ awọn metiriki didara data.
  • Ita imọ: niwon didara data ti data sintetiki ni akawe si data atilẹba jẹ bọtini, a ṣe ayẹwo laipe pẹlu awọn amoye data ti SAS (olori ọja ni awọn atupale) lati ṣe afihan didara data ti data sintetiki nipasẹ Syntho ni afiwe si data gidi. Edwin van Unen, onimọran atupale lati SAS, ṣe iṣiro awọn ipilẹ data sintetiki ti ipilẹṣẹ lati Syntho nipasẹ ọpọlọpọ awọn igbelewọn atupale (AI) ati pin awọn abajade. Wo fidio kukuru kukuru kan nibi.
  • Idanwo ati igbelewọn nipasẹ ara rẹ: Awọn data sintetiki le ṣe idanwo ati ṣe ayẹwo nipa fifiwewe si data gidi-aye tabi nipa lilo rẹ lati kọ awọn awoṣe ikẹkọ ẹrọ ati fiwera iṣẹ wọn si awọn awoṣe ti oṣiṣẹ lori data gidi-aye. Kilode ti o ko ṣe idanwo didara data ti data sintetiki nipasẹ ararẹ? Beere awọn amoye wa fun awọn aye ti eyi nibi

O ṣe pataki lati ṣe akiyesi pe data sintetiki ko le ṣe iṣeduro lati jẹ 100% iru si data atilẹba, ṣugbọn o le sunmọ to lati wulo fun ọran lilo kan pato. Ẹran lilo pato le paapaa jẹ awọn atupale ilọsiwaju tabi awọn awoṣe ikẹkọ ẹrọ ikẹkọ.

Bei on ni. Awọn data sintetiki paapaa di awọn ilana mu eyiti o ko mọ pe wọn wa ninu data atilẹba naa.

Ṣugbọn maṣe gba ọrọ wa nikan. Awọn amoye atupale ti SAS (olori ọja agbaye ni awọn atupale) ṣe iṣiro (AI) ti data sintetiki ati ṣe afiwe pẹlu data atilẹba. Ṣe iyanilenu? Wo awọn gbogbo iṣẹlẹ nibi tabi wo kukuru ti ikede nipa didara data nibi.

Bẹẹni a ṣe. Syeed wa ti wa ni iṣapeye fun awọn apoti isura infomesonu ati nitoribẹẹ, titọju iṣotitọ itọkasi laarin awọn ipilẹ data ninu datgabase.

Ṣe iyanilenu lati wa diẹ sii nipa eyi?

Beere awọn amoye wa taara.

Ìpamọ

Rara a ko. A le ni rọọrun ran Syntho Engine ṣiṣẹ lori agbegbe tabi ni awọsanma ikọkọ rẹ nipasẹ docker.

Rara A ṣe iṣapeye Syeed wa ni ọna ti o le ni irọrun gbe lọ si agbegbe igbẹkẹle ti alabara. Eyi ṣe idaniloju pe data kii yoo lọ kuro ni agbegbe igbẹkẹle ti alabara. Awọn aṣayan imuṣiṣẹ fun agbegbe ti o gbẹkẹle ti onibara wa ni "lori-ile" ati ni "awọsanma agbegbe ti onibara (awọsanma aladani)".

Iyan: Syntho ṣe atilẹyin ẹya ti o ti gbalejo ni “awọsanma Syntho”.

Rara. Ẹrọ Syntho jẹ pẹpẹ iṣẹ ti ara ẹni. Bi awọn abajade, ṣiṣẹda data sintetiki pẹlu Syntho Engine ṣee ṣe ni ọna ti o wa ninu end-to-end ilana, Syntho ko ni anfani lati wo ati pe ko nilo lati ṣe ilana data.

Bẹẹni a ṣe eyi nipasẹ ijabọ QA wa.

 

Nigbati o ba n ṣajọpọ data data kan, o ṣe pataki lati ṣafihan pe ẹnikan ko ni anfani lati tun-da awọn ẹni-kọọkan mọ. Ninu yi fidio, Marijn ṣafihan awọn igbese ikọkọ ti o wa ninu ijabọ didara wa lati ṣe afihan eyi.

Ijabọ Syntho ká QA ni meta ninu ile ise-bošewa awọn metiriki fun iṣiro aṣiri data. Ero ti o wa lẹhin ọkọọkan awọn metiriki wọnyi jẹ bi atẹle:

  • Awọn data sintetiki (S) yoo jẹ “sunmọ bi o ti ṣee”, ṣugbọn “ko sunmo pupọ” si data ibi-afẹde (T).
  • Awọn data idaduro ti a yan laileto (H) ṣe ipinnu ala-ilẹ fun “sunmọ ju”.
  • A ojutu pipe ṣe ipilẹṣẹ data sintetiki tuntun ti o huwa ni deede bi data atilẹba, ṣugbọn ko ti rii tẹlẹ (= H).

Ọkan ninu awọn ọran lilo ti o jẹ afihan ni pataki nipasẹ Aṣẹ Idaabobo Data Dutch ni lilo data sintetiki bi data idanwo.

Diẹ sii ni a le rii ninu nkan yii.

Syntho Engine

Ẹrọ Syntho naa ti wa ni gbigbe sinu apoti Docker kan ati pe o le ni irọrun gbe lọ ati ṣafọ sinu agbegbe ti o fẹ.

Awọn aṣayan imuṣiṣẹ ti o ṣee ṣe pẹlu:

  • Lori-ile-iṣẹ
  • Eyikeyi (ikọkọ) awọsanma
  • Eyikeyi miiran ayika

Ka siwaju.

Syntho ngbanilaaye lati ni irọrun sopọ pẹlu awọn data data rẹ, awọn ohun elo, awọn opo gigun ti data tabi awọn eto faili. 

A ṣe atilẹyin fun ọpọlọpọ awọn asopọ ti a ṣepọ ki o le sopọ pẹlu orisun-agbegbe (nibiti data atilẹba ti wa ni ipamọ) ati agbegbe opin irin ajo (nibiti o fẹ kọ data sintetiki rẹ si) fun end-to-end ese ona.

Awọn ẹya asopọ ti a ṣe atilẹyin:

  • Pulọọgi-ati-mu ṣiṣẹ pẹlu Docker
  • 20+ database asopọ
  • 20+ filesystem asopo

Ka siwaju.

Nipa ti, awọn iran akoko da lori awọn iwọn ti awọn database. Ni apapọ, tabili ti o kere ju awọn igbasilẹ miliọnu kan ti wa ni iṣelọpọ ni o kere ju iṣẹju marun 1.

Awọn algoridimu ikẹkọ ẹrọ Syntho le ṣe akopọ awọn ẹya dara julọ pẹlu awọn igbasilẹ nkan diẹ sii ti o wa, eyiti o dinku eewu asiri. Iwọn ọwọn-si-ila ti o kere ju ti 1:500 ni a ṣe iṣeduro. Fun apẹẹrẹ, ti tabili orisun rẹ ba ni awọn ọwọn 6, o yẹ ki o ni o kere ju awọn ori ila 3000 ninu.

Rara. Botilẹjẹpe o le gba diẹ ninu igbiyanju lati ni oye ni kikun awọn anfani, awọn iṣẹ ṣiṣe ati lilo awọn ọran ti data sintetiki, ilana ti iṣelọpọ jẹ rọrun pupọ ati pe ẹnikẹni ti o ni oye kọnputa ipilẹ le ṣe. Fun alaye diẹ sii nipa ilana iṣelọpọ, ṣayẹwo iwe yi or beere idiwo kan.

Ẹrọ Syntho naa ṣiṣẹ dara julọ lori iṣeto, data tabular (ohunkohun ti o ni awọn ori ila ati awọn ọwọn ninu). Laarin awọn ẹya wọnyi, a ṣe atilẹyin awọn iru data atẹle wọnyi:

  • Awọn igbekalẹ data ti a pa akoonu sinu awọn tabili (isọri, nọmba, ati bẹbẹ lọ)
  • Awọn idamọ taara ati PII
  • Ti o tobi datasets ati infomesonu
  • Data ipo agbegbe (bii GPS)
  • Time jara data
  • Awọn apoti isura infomesonu tabili pupọ (pẹlu iṣotitọ itọkasi)
  • Ṣii data ọrọ

 

Atilẹyin data eka
Lẹgbẹẹ gbogbo awọn oriṣi deede ti data tabular, Syntho Engine ṣe atilẹyin awọn iru data idiju ati awọn ẹya data idiju.

  • Aago akoko
  • Olona-tabili infomesonu
  • Ṣi ọrọ

Ka siwaju.

Rara, a ṣe iṣapeye pẹpẹ wa lati dinku awọn ibeere iširo (fun apẹẹrẹ ko si GPU ti o nilo), laisi ibajẹ lori deede data. Ni afikun, a ṣe atilẹyin wiwọn aifọwọyi, ki eniyan le ṣajọpọ awọn apoti isura infomesonu nla.

Bẹẹni. Sọfitiwia Syntho jẹ iṣapeye fun awọn data data ti o ni awọn tabili lọpọlọpọ ninu.

Fun eyi, Syntho ṣe iwari awọn iru data laifọwọyi, awọn eto ati awọn ọna kika lati mu iwọn deede pọ si. Fun data tabili olona-pupọ, a ṣe atilẹyin itọka ibatan tabili aladaaṣe ati iṣelọpọ lati ṣetọju iduroṣinṣin itọkasi.

egbe awon eniyan rerin

Data jẹ sintetiki, ṣugbọn ẹgbẹ wa jẹ gidi!

Kan si Syntho ati ọkan ninu awọn amoye wa yoo ni ifọwọkan pẹlu rẹ ni iyara ti ina lati ṣawari iye ti data sintetiki!