AI-generata Synthetica Data, facilis et celer accessus ad qualitatem datam?
AI generatae synthetica notitia in usu
Syntho, peritus syntheticae notitiae AI generatae, studet se vertere privacy by design in competitive commodo cum AI generatae synthetica notitia. Societates adiuvant ut fundamentum validum edificandi facili et rapido accessu ad qualitatem datam et nuper in Innovatione Philips lacus lucrati sint.
Autem, synthetica notitia generationis cum AI est solutio relativa nova quae saepe interrogationes saepe inducit. Ad haec respondere, Syntho incepit studium quoddam una cum SAS, mercato duce in Analyticis provectis et AI programmatis.
In collaboratione cum AI Coalitione Batavica (NL AIC), valorem notitiarum syntheticarum investigaverunt, comparendo syntheticas notitias AI-generatae a Engineo Syntho generatas cum data originalia per varias aestimationes in data qualitate, legali validitate et usabilitate.
Estne data anonymization non solutio?
Artes anonymizationes classicae communes habent quod notitias originales tractant ut singulos retro persequentes impediant. Exempla sunt generalizationis, suppressionis, abolitionis, pseudonymizationis, notitiarum larvarum, commissionum ordinum & columnarum. Exempla invenire potes in tabula infra.
Illae artes inducunt 3 clavem provocationes:
- Aliter operantur per typum datae et per dataset, easque difficiles ad scalas faciunt. Praeterea, cum aliter operantur, semper erit disceptandum, quibus rationibus conveniat et quibus artibus opus sit coniunctio.
- Semper est unum ad unam relationem cum notitia originali. Hoc significat periculum secreti semper futurum esse, praesertim omnibus schedulis apertis et technicis artificiis quae datastae coniungunt.
- Data manipulare et sic datas in processu destruunt. Hoc praesertim propter AI negotium devastandum ubi "potentia praedicta" est essentialis, quia mala qualitas notitiae malae indaginis ex exemplar AI AI resultabit (Purgamentum-in in palam-e).
Haec puncta etiam aesti- ria huius causae student.
Introductio ad causam studio
In casu studiorum, scopo dataset erat a telecomifico dataset provisum a SAS continens notitias 56.600 clientium. Dataset columnas 128 continet, e quibus una columna indicans num emptor societatis reliquerit vel non. Propositum causae studium erat ut synthetica notitia ad exempla quaedam instituendi ad praedicendum emptorem torquent et perpendendi exsecutionem exemplorum exercitatorum. Ut conturbant praesagium munus classificationis, quattuor exempla classificationis popularis SAS selecta ad praedictiones faciendas, inter quas:
- Random silvam
- Gradiente boosting
- Logistic regressus
- neural network
Priusquam syntheticas notitias generare, SAS passim telecomum dataset in institutum (ad exempla formandum) et laqueum (ad exempla scoring) scinditur. Habens singulas custodias positas pro scoring permittit pro pensato aestimatione quomodo bene exemplar classificationis cum novis notitiae applicatae praestare posset.
Tramen input utens, Syntho suo Syntho Engine usus est ad dataset syntheticam generandam. Ad benchmarking, SAS etiam versionem manipulatam traminis posuit post varias anonymizationes applicandas technicas ad certum limen attingendum (de k-anonimitate). Vestigia priora consecuta sunt in quattuor datasets:
- A train dataset (id the original dataset minus the holdout dataset)
- A holdout dataset (id est subset originalis dataset)
- Anonymized dataset (ex agmine dataset)
- Synthetica dataset (ex agmine dataset)
Datasets 1, 3 et 4 adhibitae sunt ad exemplar singulae classificationis instituendi, unde in 12 (3 x 4) exempla exercitata. SAS postea schedula dataset usus est ut accurationem metiretur qua quisque exemplar praedicit emptorem torquentem. Eventus infra sistuntur, incipientes a quibusdam statisticis fundamentalibus.
Figure: Machina Learning pipeline generated in SAS Visual Data Mining and Machine Learning
Basic mutant cum anonymized comparet notitia ad originale notitia
Artificia anonymizationis etiam fundamentalia exemplaria, negotiatio logica, relationes et statisticas destruunt (ut in exemplo infra). Usura anonyma data pro analyticis fundamentalibus sic dolosos proventus producit. Re vera, qualis pauper notitiarum anonymizatarum effecit, vix potest ea uti ad opera analytica provecta (exempli AI/ML exemplaria ac collisione).
Basic mutant cum synthetica notitia comparet cum originali notitia
Synthetica notitia generationis cum AI servat exemplaria fundamentalia, logicam negotia, relationes et statisticas (ut infra in exemplo). Usura synthetica notitia pro analyticis fundamentalibus ita certos eventus efficit. Clavis interrogatio, nonne synthetica notitia tenet ad opera analytica provecta (eg AI/ML exemplaria ac collisione)?
AI-generata synthetica notitia et analytica provectus
Synthetica notitia tenet non solum ad formas fundamentales (ut in prioribus argumentis demonstratur), sed etiam alta 'abstrusa' statistica exemplaria quae ad analytica provecta officia requiruntur. Posterior demonstratur in chartis clausuris infra, significans subtiliter exemplorum in synthetica notitia versuum exemplorum instructorum in notitia originali formatorum similes esse. Praeterea, cum area sub curva (AUC*) prope 0.5, exempla in anonymisedis notitiis exercitata longe pessime praestant. Plena fama cum omnibus analyticis analyticis provectis in notitia synthetica comparationem cum notitia originalis in petitione praesto est.
* AUC: area curva mensura est ad exempla analyticorum progressorum accurate, ratione habita veras positivas, falsas affirmativas, negativas falsas et negativas veras. 0,5, significat exempla passim praedicat et nullam habet vim predictive et 1 significat, quod exemplar semper rectam et plenam habeat potestatem predictive.
Accedit, haec synthetica notitia adhiberi potest ad notas notas intelligendas et variabiles praecipuas variabiles ad ipsa exemplorum conformandas necessitates. Inputationes ab algorithmis de data synthetica comparata ad notitias originales selectae erant simillimae. Hinc processus exemplaris in hac synthetica versione fieri potest, quae periculum notitiarum interruptionum minuit. Cum tamen singula monumenta inferentia (exempli gratia telco mos) retardatio originalis notitiae commendatur ad explicabilitatem, acceptationem augendam vel propter ordinationem tantum.
AUC by Algorithmus, methodo collata
Conclusiones:
- Exempla instructa in synthetica notitia comparata ad exempla quae in originalibus data exemplaribus exercitata demonstrant valde similis effectus
- Exempla instructa in anonymised data cum 'technicis classicis anonymizationis', inferioris effectus ad exempla exercitata in notitia originali vel synthetica data.
- Synthetica notitia generationis facilis et ieiuna est, quia ars eadem prorsus per dataset et per notitias formas operatur.
Valorem-addendo synthetica notitia usus casibus
Usus casus 1: Synthetica notitia ad exemplar evolutionis et analyticae provectus
Fortem notitiarum fundamentum cum facili et rapido accessu ad utibile, qualitatem altam data est essentialis ad exempla explicanda (eg dashboards [BI] et analytica provecta [AI & ML]). Sed multae consociationes laborant ex fundamento suboptimali notitiae consecutae in 3 provocationibus clavis clavis:
- Accessum ad notitias questus sumit aetatibus propter (privationem) ordinationes, processus internus seu notitia silos
- Artificia anonymizationis classicorum notitias destruunt, cum notitias non iam aptas ad analyticas et analyticas provectas (coenum in = purgamentum educunt)
- Solutiones existentes scalabiles non sunt quia aliter per dataset et per typum data operantur et non possunt magnas databases multi- mensae tractare.
Accedunt synthetica notitia: exempla evolvere cum notitia synthetica reali sicut-bona ad:
- Obscuratis uti notitia originalis, sine impedimento developers
- Reserare personalis notitias et accessum ad plura data quae antea restricta erat (exempli gratia propter secretum)
- Securus et velox notitia aditus ad pertinet notitia
- Solutio scalabilis quae eadem operatur in singulis dataset, datatype et pro massivis databases
Hoc permittit organizationem ut fundamen- tum validum fundationis edificandi facili et rapido accessu ad utibile, altae qualitates notitias ad notitias reserandas ac datas opportunitates pressionibus patefaciat.
Usus causa 2: captiosus synthetica test notitia pro probatio software, progressio et traditio
Tentatio et progressio cum maxima qualitatum testium notitia essentialis est solutiones programmatis liberare status-of-artis. Data productio originalis usus evidens videtur, sed ob normas (privatas) normas non licet. Alternativum Test Data Management Instrumenta inducere "legacy-by-design"In questus test data recta:
- Notitia productionis et negotii logicae et relativae integritatis non reflectuntur
- Operatur tardus et tempus perussi
- Manual opus est requiritur
Accedunt synthetica notitia: Test et explica cum AI-generato synthetica test data ad liberandum solutiones programmatum statu-of-artis doluerunt cum:
- Productio-similis notitiae cum conservatis negotiis logicae et integritatis relativae
- Facile et velox notitia generationis cum statu-of-artis AI
- Secretum-by-design
- Securus, velox et agile
Hoc permittit organizationem probare et evolvere cum proximo-gradu testium notitiarum ad solvendas solutiones software status-of-artis!
magis notitia
Quaero? Plura de synthetica notitia, visita Syntho website vel contactus Wim Kees Janssen. Pro pluribus informationibus de SAS, visita www.sas.com or contact kees@syntho.ai.
In hoc casu usu Syntho, SAS et NL AIC cooperantur ad intentos eventus consequendos. Syntho peritus est syntheticarum notitiarum AI generatae et SAS mercatum ducem in analyticis et programmatum praebet explorandi, analysendi et visualisandi notitias.
* Praedic 2021 - Data et Analytica Strategies gubernandi, Scala et Transformatio Digitalis Negotia, Gartner, MMX.
Servo tuo synthetica notitia dux nunc!
- Saccharum notitia quid est?
- Cur institutiones ea utuntur?
- Valorem addit synthetica notitia clientis casibus
- Quam incipere