AI-generata Synthetica Data, facilis et celer accessus ad qualitatem datam?

AI generatae synthetica notitia in usu

Syntho, peritus syntheticae notitiae AI generatae, studet se vertere privacy by design in competitive commodo cum AI generatae synthetica notitia. Societates adiuvant ut fundamentum validum edificandi facili et rapido accessu ad qualitatem datam et nuper in Innovatione Philips lacus lucrati sint.

Autem, synthetica notitia generationis cum AI est solutio relativa nova quae saepe interrogationes saepe inducit. Ad haec respondere, Syntho incepit studium quoddam una cum SAS, mercato duce in Analyticis provectis et AI programmatis.

In collaboratione cum AI Coalitione Batavica (NL AIC), valorem notitiarum syntheticarum investigaverunt, comparendo syntheticas notitias AI-generatae a Engineo Syntho generatas cum data originalia per varias aestimationes in data qualitate, legali validitate et usabilitate.

Estne data anonymization non solutio?

Artes anonymizationes classicae communes habent quod notitias originales tractant ut singulos retro persequentes impediant. Exempla sunt generalizationis, suppressionis, abolitionis, pseudonymizationis, notitiarum larvarum, commissionum ordinum & columnarum. Exempla invenire potes in tabula infra.

data anonymization

Illae artes inducunt 3 clavem provocationes:

  1. Aliter operantur per typum datae et per dataset, easque difficiles ad scalas faciunt. Praeterea, cum aliter operantur, semper erit disceptandum, quibus rationibus conveniat et quibus artibus opus sit coniunctio.
  2. Semper est unum ad unam relationem cum notitia originali. Hoc significat periculum secreti semper futurum esse, praesertim omnibus schedulis apertis et technicis artificiis quae datastae coniungunt.
  3. Data manipulare et sic datas in processu destruunt. Hoc praesertim propter AI negotium devastandum ubi "potentia praedicta" est essentialis, quia mala qualitas notitiae malae indaginis ex exemplar AI AI resultabit (Purgamentum-in in palam-e).

Haec puncta etiam aesti- ria huius causae student.

Introductio ad causam studio

In casu studiorum, scopo dataset erat a telecomifico dataset provisum a SAS continens notitias 56.600 clientium. Dataset columnas 128 continet, e quibus una columna indicans num emptor societatis reliquerit vel non. Propositum causae studium erat ut synthetica notitia ad exempla quaedam instituendi ad praedicendum emptorem torquent et perpendendi exsecutionem exemplorum exercitatorum. Ut conturbant praesagium munus classificationis, quattuor exempla classificationis popularis SAS selecta ad praedictiones faciendas, inter quas:

  1. Random silvam
  2. Gradiente boosting
  3. Logistic regressus
  4. neural network

Priusquam syntheticas notitias generare, SAS passim telecomum dataset in institutum (ad exempla formandum) et laqueum (ad exempla scoring) scinditur. Habens singulas custodias positas pro scoring permittit pro pensato aestimatione quomodo bene exemplar classificationis cum novis notitiae applicatae praestare posset.

Tramen input utens, Syntho suo Syntho Engine usus est ad dataset syntheticam generandam. Ad benchmarking, SAS etiam versionem manipulatam traminis posuit post varias anonymizationes applicandas technicas ad certum limen attingendum (de k-anonimitate). Vestigia priora consecuta sunt in quattuor datasets:

  1. A train dataset (id the original dataset minus the holdout dataset)
  2. A holdout dataset (id est subset originalis dataset)
  3. Anonymized dataset (ex agmine dataset)
  4. Synthetica dataset (ex agmine dataset)

Datasets 1, 3 et 4 adhibitae sunt ad exemplar singulae classificationis instituendi, unde in 12 (3 x 4) exempla exercitata. SAS postea schedula dataset usus est ut accurationem metiretur qua quisque exemplar praedicit emptorem torquentem. Eventus infra sistuntur, incipientes a quibusdam statisticis fundamentalibus.

Apparatus Learning pipeline generatur in SAS

Figure: Machina Learning pipeline generated in SAS Visual Data Mining and Machine Learning

Basic mutant cum anonymized comparet notitia ad originale notitia

Artificia anonymizationis etiam fundamentalia exemplaria, negotiatio logica, relationes et statisticas destruunt (ut in exemplo infra). Usura anonyma data pro analyticis fundamentalibus sic dolosos proventus producit. Re vera, qualis pauper notitiarum anonymizatarum effecit, vix potest ea uti ad opera analytica provecta (exempli AI/ML exemplaria ac collisione).

comparet anonymized notitia ad originale notitia

Basic mutant cum synthetica notitia comparet cum originali notitia

Synthetica notitia generationis cum AI servat exemplaria fundamentalia, logicam negotia, relationes et statisticas (ut infra in exemplo). Usura synthetica notitia pro analyticis fundamentalibus ita certos eventus efficit. Clavis interrogatio, nonne synthetica notitia tenet ad opera analytica provecta (eg AI/ML exemplaria ac collisione)?

omparing synthetica notitia ad originale notitia

AI-generata synthetica notitia et analytica provectus

Synthetica notitia tenet non solum ad formas fundamentales (ut in prioribus argumentis demonstratur), sed etiam alta 'abstrusa' statistica exemplaria quae ad analytica provecta officia requiruntur. Posterior demonstratur in chartis clausuris infra, significans subtiliter exemplorum in synthetica notitia versuum exemplorum instructorum in notitia originali formatorum similes esse. Praeterea, cum area sub curva (AUC*) prope 0.5, exempla in anonymisedis notitiis exercitata longe pessime praestant. Plena fama cum omnibus analyticis analyticis provectis in notitia synthetica comparationem cum notitia originalis in petitione praesto est.

* AUC: area curva mensura est ad exempla analyticorum progressorum accurate, ratione habita veras positivas, falsas affirmativas, negativas falsas et negativas veras. 0,5, significat exempla passim praedicat et nullam habet vim predictive et 1 significat, quod exemplar semper rectam et plenam habeat potestatem predictive.

Accedit, haec synthetica notitia adhiberi potest ad notas notas intelligendas et variabiles praecipuas variabiles ad ipsa exemplorum conformandas necessitates. Inputationes ab algorithmis de data synthetica comparata ad notitias originales selectae erant simillimae. Hinc processus exemplaris in hac synthetica versione fieri potest, quae periculum notitiarum interruptionum minuit. Cum tamen singula monumenta inferentia (exempli gratia telco mos) retardatio originalis notitiae commendatur ad explicabilitatem, acceptationem augendam vel propter ordinationem tantum.                              

AUC by Algorithmus, methodo collata

urbis

Conclusiones:

  • Exempla instructa in synthetica notitia comparata ad exempla quae in originalibus data exemplaribus exercitata demonstrant valde similis effectus
  • Exempla instructa in anonymised data cum 'technicis classicis anonymizationis', inferioris effectus ad exempla exercitata in notitia originali vel synthetica data.
  • Synthetica notitia generationis facilis et ieiuna est, quia ars eadem prorsus per dataset et per notitias formas operatur.

Valorem-addendo synthetica notitia usus casibus

Usus casus 1: Synthetica notitia ad exemplar evolutionis et analyticae provectus

Fortem notitiarum fundamentum cum facili et rapido accessu ad utibile, qualitatem altam data est essentialis ad exempla explicanda (eg dashboards [BI] et analytica provecta [AI & ML]). Sed multae consociationes laborant ex fundamento suboptimali notitiae consecutae in 3 provocationibus clavis clavis:

  • Accessum ad notitias questus sumit aetatibus propter (privationem) ordinationes, processus internus seu notitia silos
  • Artificia anonymizationis classicorum notitias destruunt, cum notitias non iam aptas ad analyticas et analyticas provectas (coenum in = purgamentum educunt)
  • Solutiones existentes scalabiles non sunt quia aliter per dataset et per typum data operantur et non possunt magnas databases multi- mensae tractare.

Accedunt synthetica notitia: exempla evolvere cum notitia synthetica reali sicut-bona ad:

  • Obscuratis uti notitia originalis, sine impedimento developers
  • Reserare personalis notitias et accessum ad plura data quae antea restricta erat (exempli gratia propter secretum)
  • Securus et velox notitia aditus ad pertinet notitia
  • Solutio scalabilis quae eadem operatur in singulis dataset, datatype et pro massivis databases

Hoc permittit organizationem ut fundamen- tum validum fundationis edificandi facili et rapido accessu ad utibile, altae qualitates notitias ad notitias reserandas ac datas opportunitates pressionibus patefaciat.

 

Usus causa 2: captiosus synthetica test notitia pro probatio software, progressio et traditio

Tentatio et progressio cum maxima qualitatum testium notitia essentialis est solutiones programmatis liberare status-of-artis. Data productio originalis usus evidens videtur, sed ob normas (privatas) normas non licet. Alternativum Test Data Management Instrumenta inducere "legacy-by-design"In questus test data recta:

  • Notitia productionis et negotii logicae et relativae integritatis non reflectuntur
  • Operatur tardus et tempus perussi
  • Manual opus est requiritur

Accedunt synthetica notitia: Test et explica cum AI-generato synthetica test data ad liberandum solutiones programmatum statu-of-artis doluerunt cum:

  • Productio-similis notitiae cum conservatis negotiis logicae et integritatis relativae
  • Facile et velox notitia generationis cum statu-of-artis AI
  • Secretum-by-design
  • Securus, velox et agile

Hoc permittit organizationem probare et evolvere cum proximo-gradu testium notitiarum ad solvendas solutiones software status-of-artis!

magis notitia

Quaero? Plura de synthetica notitia, visita Syntho website vel contactus Wim Kees Janssen. Pro pluribus informationibus de SAS, visita www.sas.com or contact kees@syntho.ai.

In hoc casu usu Syntho, SAS et NL AIC cooperantur ad intentos eventus consequendos. Syntho peritus est syntheticarum notitiarum AI generatae et SAS mercatum ducem in analyticis et programmatum praebet explorandi, analysendi et visualisandi notitias.

* Praedic 2021 - Data et Analytica Strategies gubernandi, Scala et Transformatio Digitalis Negotia, Gartner, MMX.

syntho dux operimentum

Servo tuo synthetica notitia dux nunc!