Data tsy fantatra anarana vs data Synthetic

Raha ataonao tsy mitonona anarana ny angon-drakitrao alohan'ny hanaovana fitiliana angon-drakitra momba ny famakafakana angona, dia misy antony maromaro:

  1. Amin'ny ankamaroan'ny toe-javatra rehetra, ny angon-drakitra tsy mitonona anarana dia mbola azo jerena any amin'ny olona tsirairay noho ny andalana manokana sy miavaka (oh: firaketana ara-pitsaboana)
  2. Arakaraky ny anaovanao anarana na fanatanjahatena no betsaka kokoa ny angona potehinao. Mampidina ny kalitaon'ny angonao izany ary noho izany dia mampihena ny fahitanao
  3. Ny fanaovana anonymization dia miasa amin'ny fomba hafa amin'ny endrika data samihafa. Midika izany fa tsy azo scalable ary mety handany fotoana be

Ny data synthetic dia mamaha ireo lesoka rehetra ireo sy ny maro hafa. Jereo ny horonan-tsary eto ambany hahitanao manam-pahaizana momba ny analyse avy amin'ny SAS (mpitarika ny tsena maneran-tany amin'ny analyse) manazava momba ny tombanany momba ny fahasamihafan'ny kalitaon'ny angon-drakitra tany am-boalohany, ny angona tsy fantatra anarana ary ny angon-drakitra noforonin'i Syntho.

Ity horonantsary ity dia nalaina tao amin'ny Syntho x SAS D[N]A Café momba ny AI Generated Synthetic Data. Tadiavo eto ny video feno.

Nandefa angona tany am-boalohany tany Syntho i Edwin van Unen ary natambatray ny angona. Saingy ny fanontaniana dia hoe: "Inona no hitranga raha mampitaha ny angona synthetic amin'ny angon-drakitra tsy fantatra anarana isika?" Satria very fampahalalana be dia be amin'ny angon-drakitra tsy fantatra anarana ianao, hitranga koa ve izany rehefa manambatra angon-drakitra? Nanomboka tamin'ny angon-drakitra avy amin'ny indostrian'ny fifandraisan-davitra misy andalana 56.000 sy tsanganana 128 misy fampahalalana momba ny orinasa. Ity angona ity dia sady natambatra no tsy nitonona anarana mba hahafahan'i Edwin mampitaha ny synthetization amin'ny tsy mitonona anarana. Avy eo, nanomboka nanao modely tamin'ny SAS Viya i Edwin. Nanangana modely churn roa izy tamin'ny angon-drakitra tany am-boalohany, tamin'ny fampiasana teknika fihemorana klasika sy hazo fanapaha-kevitra, fa koa teknika be pitsiny kokoa toy ny tambajotra neural, fanamafisana ny gradient, ala kisendrasendra - ireo karazana teknika ireo. Mampiasa ny safidy SAS Viya mahazatra rehefa manamboatra ireo modely.

Avy eo, tonga ny fotoana hijerena ny vokatra. Tena nampanantena ny valiny ho an'ny angona synthetic fa tsy ho an'ny tsy anarana. Ho an'ireo manam-pahaizana tsy mianatra amin'ny milina amin'ny mpihaino, dia mijery ny faritra eo ambanin'ny curve ROC izay milaza zavatra momba ny fahamarinan'ny modely. Ny fampitahana ny angon-drakitra tany am-boalohany amin'ny angon-drakitra tsy fantatra anarana, dia hitantsika fa ny modely angon-drakitra tany am-boalohany dia manana faritra eo ambanin'ny curve ROC an'ny .8, izay tena tsara, Na izany aza, ny angona tsy fantatra anarana dia manana faritra eo ambanin'ny curve ROC an'ny .6. Midika izany fa very fampahalalana be dia be izahay miaraka amin'ny maodely tsy fantatra anarana ka very hery maminavina be dia be ianao.

Fa avy eo, ny fanontaniana dia ny momba ny data synthetics? Teto dia nanao toy izany koa izahay fa raha tokony ho tsy nitonona anarana ny angon-drakitra, dia nosintonin'i Syntho ny angon-drakitra. Ankehitriny, hitantsika na ny angon-drakitra tany am-boalohany sy ny angona synthetic dia manana faritra eo ambanin'ny curve ROC amin'ny .8, izay tena mitovy. Tsy mitovy tanteraka noho ny fiovaovana, fa tena mitovy. Midika izany fa tena mampanantena ny mety hisian'ny angon-drakitra sintetika - faly be momba izany i Edwin.

vondron'olona mitsiky

Ny angona dia synthetic, fa ny ekipanay dia tena izy!

Mifandraisa amin'i Syntho ary ny iray amin'ireo manam-pahaizana aminay dia hifandray aminao amin'ny hafainganam-pandehan'ny hazavana hijerena ny lanjan'ireo angona syntetika!