مستعار معلومات په مقابل کې مصنوعي ډاټا

که تاسو د ډیټا تحلیلونو ډیټا ازموینې ترسره کولو دمخه خپل ډیټا نامعلوم کړئ ، نو په لوبې کې ډیری فاکتورونه شتون لري:

  1. په نږدې ټولو قضیو کې، نامعلوم معلومات لاهم د ځانګړو او ځانګړو قطارونو (د بیلګې په توګه د طبي ریکارډونو) له امله خلکو ته بیرته موندل کیدی شي.
  2. هرڅومره چې تاسو نوم پټ کړئ یا عمومي کړئ ، هومره ډیر معلومات تاسو له مینځه وړئ. دا ستاسو د معلوماتو کیفیت ټیټوي او پدې توګه ستاسو لیدونه
  3. د مختلف ډیټا فارمیټونو لپاره نامعلوم کول په مختلف ډول کار کوي. دا پدې مانا ده چې دا د توزیع وړ ندي او ډیر وخت مصرف کیدی شي

مصنوعي ډاټا دا ټولې نیمګړتیاوې حلوي او نور. لاندې ویډیو وګورئ چې د SAS (په تحلیل کې د نړیوال بازار مشر) د تحلیلي متخصص لیدلو لپاره د اصلي ډیټا ، نامعلوم شوي ډیټا او سینتو لخوا رامینځته شوي مصنوعي ډیټا ترمینځ د کیفیت توپیر په اړه د هغه ارزونې تشریح کوي.

دا ویډیو د AI تولید شوي مصنوعي ډیټا په اړه د Syntho x SAS D[N]A Café څخه اخیستل شوې. بشپړ ویډیو دلته ومومئ.

اډون وان یون سینتو ته یو اصلي ډیټاسیټ لیږلی او موږ ډیټاسیټ ترکیب کړی. مګر پوښتنه دا هم وه: "څه به پیښ شي که موږ مصنوعي ډیټا د نامعلومو معلوماتو سره پرتله کړو؟" ځکه چې تاسو په نامعلوم شوي ډیټا کې ډیری معلومات له لاسه ورکوئ، ایا دا به هم پیښ شي کله چې د ډیټاسیټ ترکیب کول؟ موږ د مخابراتو صنعت څخه د 56.000 قطارونو او 128 کالمونو سره د شرکت د منحل معلوماتو معلوماتو سره پیل کړی. دا ډیټاسیټ دواړه ترکیب شوي او مستعار شوي و نو اډون کولی شي ترکیب د نامعلوم کولو سره پرتله کړي. بیا، اډون د SAS وییا په کارولو سره ماډلینګ پیل کړ. هغه په ​​اصلي ډیټاسیټ کې د چرن ماډلونه جوړ کړل، د کلاسیک ریګریشن تخنیکونو او د پریکړې ونې په کارولو سره، مګر نور پیچلي تخنیکونه لکه عصبي شبکې، تدریجي وده، تصادفي ځنګل - دا ډول تخنیکونه. د ماډلونو جوړولو پر مهال د معیاري SAS وییا اختیارونو کارول.

بیا، دا وخت و چې پایلې وګورئ. پایلې د مصنوعي معلوماتو لپاره خورا ژمنې وې او نه د نوم نه ښودلو لپاره. په لیدونکو کې د هیڅ ماشین زده کړې متخصصینو لپاره ، موږ د ROC- curve لاندې ساحه ګورو چې د ماډل دقت په اړه یو څه وايي. اصلي ډیټا د نامعلوم شوي ډیټا سره پرتله کول ، موږ ګورو چې د اصلي ډیټا ماډل د .8 د ROC- وکر لاندې ساحه لري ، کوم چې خورا ښه دی ، په هرصورت ، نامعلوم شوي ډیټا د .6 د ROC- وکر لاندې ساحه لري. دا پدې مانا ده چې موږ د نامعلوم ماډل سره ډیری معلومات له لاسه ورکوو نو تاسو د وړاندوینې ډیر ځواک له لاسه ورکوئ.

مګر بیا، پوښتنه دا ده چې د مصنوعي معلوماتو په اړه څه دي؟ دلته، موږ په سمه توګه ورته کار وکړ مګر د دې پرځای چې د ډاټا نوم پټ کړي، سنتو ډاټا ترکیب کړل. اوس، موږ ګورو چې اصلي ډاټا او مصنوعي ډاټا دواړه د .8 د ROC- curve لاندې ساحه لري، کوم چې خورا ورته دی. د تغیر له امله بالکل ورته نه ، مګر خورا ورته. دا پدې مانا ده چې د مصنوعي معلوماتو احتمال خورا ژمن دی - اډون پدې اړه ډیر خوښ دی.

د خلکو موسکا

ډاټا مصنوعي ده، مګر زموږ ټیم ریښتیا دی!

له سنتو سره اړیکه ونیسئ او زموږ یو متخصص به د مصنوعي معلوماتو ارزښت سپړلو لپاره د ر light ا سرعت سره تاسو سره اړیکه ونیسي!