اټکل وکړه څوک؟ 5 مثالونه ولې د نومونو لرې کول یو اختیار ندی

اټکل وکړئ چې څوک لوبه کوي

د چا په اړه پیژندنه

اټکل وکړه څوک؟ که څه هم زه ډاډه یم چې ستاسو څخه ډیری دا لوبه په تیرو ورځو کې پیژني ، دلته یو لنډ لنډیز. د لوبې هدف: د "هو" او "نه" پوښتنو په کولو سره ستاسو د سیال لخوا غوره شوي د کارتون کرکټر نوم کشف کړئ ، لکه 'ایا سړی خولۍ اغوندي؟' یا 'ایا شخص شیشه اغوندي'؟ لوبغاړي د مخالف ځواب په اساس نوماندان له مینځه وړي او هغه ځانګړتیاوې زده کوي چې د دوی د مخالف اسرار شخصیت پورې اړه لري. لومړی لوبغاړی چې د بل لوبغاړي اسرار شخصیت پیژني لوبه وګټي.

تاسو دا ترلاسه کړل. یو څوک باید اړونده ځانګړتیاو ته د لاسرسي په درلودو سره د ډیټاسیټ څخه بهر فرد وپیژني. په حقیقت کې ، موږ په منظم ډول د ګیس دا مفهوم ګورو چې په عمل کې یې پلي کړي ، مګر بیا د قطارونو او کالمونو فارمیټ شوي ډیټاسټونو کې ګمارل شوي چې د ریښتیني خلکو صفات لري. اصلي توپیر کله چې د معلوماتو سره کار کول دا وي چې خلک د اسانتیا کمولو ته لیواله وي چې له مخې یې یوازې یو څو ځانګړتیاو ته د لاسرسي په واسطه ریښتیني اشخاص خلاص کیدی شي.

لکه څنګه چې د ګیس څوک لوبه روښانه کوي ، یو څوک کولی شي یوازې څو ځانګړتیاو ته د لاسرسي له لارې اشخاص وپیژني. دا د یو ساده مثال په توګه کار کوي چې ولې ستاسو د ډیټاسټ څخه یوازې 'نومونه' (یا نور مستقیم پیژندونکي) لرې کول د نوم نه ورکولو تخنیک په توګه ناکام کیږي. پدې بلاګ کې ، موږ څلور عملي قضیې چمتو کوو ترڅو تاسو ته د ډیټا نامعلوم کولو وسیلې په توګه د کالمونو لرې کولو سره تړلي د محرمیت خطرونو په اړه خبر کړو.

2) د ارتباط بریدونه: ستاسو ډیټاسیټ د نورو (عامه) ډیټا سرچینو سره وصل دی

د ارتباطي بریدونو خطر ترټولو مهم دلیل دی چې ولې یوازې د نومونو لرې کول د نوم نه ښودلو میتود په توګه کار کوي (نور). د ارتباط برید سره ، برید کونکی اصلي معلومات د نورو لاسرسي وړ ډیټا سرچینو سره ترکیب کوي ترڅو په ځانګړي ډول یو فرد وپیژني او د دې کس په اړه (اکثرا حساس) معلومات زده کړي.

دلته کلي د نورو معلوماتو سرچینو شتون دی چې اوس شتون لري ، یا ممکن په راتلونکي کې موجود شي. د ځان په اړه فکر وکړئ. ستاسو څومره شخصي معلومات په فېسبوک ، انسټاګرام یا لینکډین کې موندل کیدی شي چې ممکن د ارتباط برید لپاره ناوړه ګټه پورته شي؟

په تیرو ورځو کې ، د معلوماتو شتون خورا ډیر محدود و ، کوم چې یو څه تشریح کوي چې ولې د نومونو حذف کول د افرادو محرمیت ساتلو لپاره کافي و. لږ شتون لرونکي ډاټا د ډیټا لینک کولو لپاره لږ فرصتونه معنی لري. په هرصورت ، موږ اوس د ډیټا پرمخ وړ اقتصاد کې (فعال) برخه اخیستونکي یو ، چیرې چې د ډیټا مقدار په ناڅاپي نرخ وده کوي. ډیر معلومات ، او د معلوماتو راټولولو لپاره ټیکنالوژي ښه کول به د ارتباطي بریدونو ډیر احتمال لامل شي. څوک به د ارتباطي برید خطر په اړه په لسو کلونو کې څه لیکي؟

انځور 1

د ګړندۍ وده کونکي ډیټا یو حقیقت دی

د معلوماتو مقدار

د قضیې مطالعه

سویني (2002) په یوه اکاډمیک مقاله کې وښودله چې څنګه هغه وکولای شول په متحده ایالاتو کې د رایې ورکونې راجستر کونکي ته د "روغتون لیدنو" عامه موجود ډیټا سیټ سره وصل کولو پراساس له افرادو څخه حساس طبي معلومات وپیژني او بیرته ترلاسه کړي. دواړه ډیټسیټونه چیرې چې د نومونو او نورو مستقیم پیژندونکو حذف کولو له لارې په مناسب ډول نوم نه اخیستل فرض شوي.

انځور 2

په عمل کې د ارتباط برید

د تړاو برید

یوازې د درې پیرامیټرو (1) زپ کوډ ، (2) جندر او (3) د زیږیدو نیټې پراساس ، هغې وښودله چې د متحده ایالاتو ټول نفوس 87 both د دواړه ډیټاسټونو څخه د پورته ذکر شوي ځانګړتیاو سره سمون له مخې بیا پیژندل کیدی شي. سویني بیا خپل کار د 'زپ کوډ' بدیل په توګه د 'هیواد' درلودو سره تکرار کړ. سربیره پردې ، هغې وښودله چې د متحده ایالاتو ټول نفوس 18 only یوازې د ډیټاسټ لاسرسي سره پیژندل کیدی شي چې د (1) کور هیواد ، (2) جندر او (3) زیږون نیټه پکې وي. د پورته ذکر شوي عامه سرچینو په اړه فکر وکړئ ، لکه فیسبوک ، لینکډین یا انسټاګرام. ایا ستاسو هیواد ، جندر او د زیږون نیټه لیدل کیږي ، یا نور کارونکي د دې کمولو توان لري؟

انځور 3

د سویني پایلې

نیمه پیژندونکي

د متحده ایالاتو نفوس په ځانګړي ډول پیژندل شوی (248 ملیون)

د 5 عددي زپ ، جنس ، د زیږون نیټه

۸۵٪

ځایجنس ، د زیږون نیټه

۸۵٪

هیوادجنس ، د زیږون نیټه

۸۵٪

دا مثال ښیې چې دا د پام وړ اسانه کیدی شي د اشخاصو نومونه په ظاهري ډول نامعلوم ډیټا کې. لومړی ، دا څیړنه د خطر لوی شدت په ګوته کوي ، لکه د متحده ایالاتو 87 population نفوس په کارولو سره په اسانۍ پیژندل کیدی شي لږ ځانګړتیاوې. دوهم ، پدې څیړنه کې افشا شوي طبي معلومات خورا حساس و. د روغتون څخه لیدنې ډیټاسیټ څخه د افشا شوي اشخاصو معلوماتو بیلګې قومیت ، تشخیص او درمل شامل دي. هغه ځانګړتیاوې چې یو یې ممکن پټ وساتي ، د مثال په توګه ، د بیمې شرکتونو څخه.

3) باخبره اشخاص

د مستقیم پیژندونکو لرې کولو بل خطر ، لکه نومونه ، هغه وخت راپورته کیږي کله چې خبر شوي اشخاص په ډیټاسټ کې د ځانګړو اشخاصو ځانګړتیاو یا چلند په اړه غوره پوهه یا معلومات ولري. د دوی د پوهې پراساس ، برید کونکی ممکن بیا د دې وړتیا ولري چې د ځانګړو معلوماتو ریکارډونه ریښتیني خلکو سره وصل کړي.

د قضیې مطالعه

د غوره پوهې په کارولو سره په ډیټسیټ د برید یوه بیلګه د نیویارک ټیکسي قضیه ده ، چیرې چې اتاکار (2014) وتوانید چې ځانګړي اشخاص خلاص کړي. ګمارل شوي ډیټاسټ کې په نیویارک کې د ټیکسي ټول سفرونه شامل وو ، د لومړني ځانګړتیاو سره بډایه شوي لکه د پیل همغږي ، د پای همغږي ، قیمت او د سواری لارښوونه.

یو باخبره فرد چې پوهیږي نیویارک کولی شي د بالغ کلب 'هسلر' ته د ټیکسي سفرونه ترلاسه کړي. د 'پای ځای' په فلټر کولو سره ، هغه د پیل دقیق ادرسونه کم کړل او پدې توګه یې مختلف مکرر لیدونکي وپیژندل. په ورته ډول ، یو څوک کولی شي د ټیکسي سواری تخفیف کړي کله چې د انفرادي کور پته معلومه وي. د ډیری مشهور فلمي ستورو وخت او موقعیت د ګپ شپ سایټونو کې کشف شوي. د دې معلوماتو د NYC ټیکسي ډیټا سره وصلولو وروسته ، د دوی د ټیکسي سپرلۍ ، هغه مقدار چې دوی تادیه کړې ، او ایا دوی ورته لارښوونه کړې وه ترلاسه کول اسانه و.

انځور 4

یو باخبره شخص

د غورځیدو همغږي کونکي هسلر

بریډلی کوپر

ټکسي او نقشه

جیسیکا البا

د نقشې تعقیب

4) د ګوتو نښې په توګه ډاټا

د استدلال یو عام لیک دا دی 'دا ډاټا بې ارزښته ده' یا 'هیڅوک نشي کولی د دې ډیټا سره څه وکړي'. دا اکثرا یو غلط فهم دی. حتی خورا بې ګناه معلومات کولی شي یو ځانګړی 'د ګوتو نښې' رامینځته کړي او د اشخاصو د بیا پیژندلو لپاره وکارول شي. دا هغه خطر دی چې له باور څخه اخیستل شوی چې ډاټا پخپله بې ارزښته ده ، پداسې حال کې چې دا ندي.

د پیژندنې خطر به د ډیټا ، AI ، او نورو وسیلو او الګوریتمونو زیاتوالي سره ډیریږي چې په ډیټا کې د پیچلو اړیکو افشا کولو وړتیا ورکوي. په پایله کې ، حتی که ستاسو ډیټاسیټ اوس خلاص نشي ، او شاید نن د غیر مجاز اشخاصو لپاره بیکاره وي ، دا ممکن سبا نه وي.

د قضیې مطالعه

یو عالي مثال هغه قضیه ده چیرې چې Netflix د دوی د فلم سپارښتنې سیسټم ښه کولو لپاره د خلاص Netflix سیالۍ معرفي کولو سره د خپل R&D ډیپارټمنټ راټولولو اراده لري. 'هغه څوک چې د فلمونو لپاره د کارونکي درجې وړاندوینې لپاره د همکارۍ فلټر کولو الګوریتم ته وده ورکوي د 1,000,000،XNUMX،XNUMX امریکایی ډالرو جایزه ګټي'. د خلکو د ملاتړ لپاره ، Netflix یو ډیټسیټ خپور کړ چې پکې یوازې لاندې لومړني صفات شامل دي: د کارونکي ID ، فلم ، د درجې نیټه او درجه (نو د کارونکي یا فلم په اړه نور معلومات شتون نلري).

انځور 5

د ډیټاسټ جوړښت د Netflix قیمت

کارن نوم فلم د درجې نیټه ټولګي
123456789 ماموریت ناممکن دی 10-12-2008 4

په انزوا کې ، معلومات بیکاره ښکاري. کله چې پوښتنه وپوښتئ 'ایا په ډیټاسټ کې د پیرودونکو کوم معلومات شتون لري چې باید شخصي وساتل شي؟' ، ځواب یې دا و:

 'نه ، د پیرودونکي پیژندنې ټول معلومات حذف شوي ټول هغه څه چې پاتې دي درجه بندي او نیټې دي. دا زموږ د محرمیت پالیسي تعقیبوي ... '

په هرصورت ، ناراینان (2008) په آسټین کې د ټیکساس پوهنتون څخه بل ډول ثابت شو. د درجې ، د درجې نیټې او د یو فرد فلم ترکیب یو ځانګړی فلم-د ګوتو نښې جوړوي. د خپل خپل Netflix چلند په اړه فکر وکړئ. ستاسو په اند څومره خلکو ورته فلمونه کتلي؟ څومره خلکو په ورته وخت کې د ورته فلمونو سیټ لیدلی؟

اصلي پوښتنه ، څنګه د دې ګوتو نښان سره سمون ولرئ؟ دا خورا ساده وه. د مشهور فلم درجه بندي ویب پا IMې IMDb (د انټرنیټ مووي ډیټابیس) د معلوماتو پراساس ، ورته د ګوتو نښې رامینځته کیدی شي. په پایله کې ، اشخاص بیا پیژندل کیدی شي.

پداسې حال کې چې د فلم لیدونکي چلند ممکن د حساس معلوماتو په توګه ونه ګل شي ، د خپل چلند په اړه فکر وکړئ-ایا تاسو به پام وکړئ که دا عامه شي؟ هغه مثالونه چې ناریانان په خپله مقاله کې چمتو کړي دي سیاسي غوره توبونه دي (د 'عیسی ناصرت' او 'جان انجیل' درجه بندي) او جنسي غوره توبونه (په 'بینټ' او 'لوک په توګه کویر' باندې درجه بندي) چې په اسانۍ سره توزیع کیدی شي.

5) د معلوماتو ساتنې عمومي مقررات (GDPR)

GDPR ممکن خورا په زړه پوری نه وي ، او نه هم د بلاګ موضوعاتو په مینځ کې د سپینو زرو. لاهم ، دا ګټور دي چې د شخصي معلوماتو پروسس کولو پرمهال مستقیم تعریفونه ترلاسه کړئ. څرنګه چې دا بلاګ د ډیټا نوم نه ښودلو او تاسو ته د ډیټا پروسیسر په توګه ښوونې لپاره د کالمونو لرې کولو عام غلط فهمۍ په اړه دی ، راځئ چې د GDPR په وینا د نوم نه ښودلو تعریف سپړلو سره پیل وکړو. 

د GDPR څخه 26 تلاوت له مخې ، نامعلوم معلومات په لاندې ډول تعریف شوي:

'هغه معلومات چې د پیژندل شوي یا پیژندل شوي طبیعي شخص یا شخصي معلوماتو سره تړاو نلري په دې ډول نامعلوم شوي چې د معلوماتو موضوع نه وي یا نور د پیژندلو وړ نه وي.'

لدې چې یو څوک شخصي معلومات پروسس کوي چې په طبیعي شخص پورې اړه لري ، د تعریف یوازې 2 برخه اړونده ده. د تعریف سره مطابقت کولو لپاره ، یو څوک باید ډاډ ترلاسه کړي چې د ډیټا موضوع (انفرادي) نه پیژندل کیږي یا نور د پیژندلو وړ ندي. لکه څنګه چې پدې بلاګ کې اشاره شوې ، په هرصورت ، د یو څو ځانګړتیاو پراساس د اشخاصو پیژندل خورا د پام وړ ساده دي. نو ، د ډیټاسیټ څخه د نومونو لرې کول د نوم نه ښودلو GDPR تعریف سره مطابقت نلري.

په پای کښې

موږ یو په عام ډول په پام کې نیولو سره ننګولی او ، له بده مرغه ، لاهم د ډیټا نامعلوم کولو تکراري تګلاره: د نومونو حذف کول. په ګیس څوک لوبه کې او پدې اړه څلور نور مثالونه:

  • اړیکې بریدونه
  • باخبره اشخاص
  • د ګوتو نښې په توګه ډاټا
  • د عمومي معلوماتو د ساتنې مقررات) GDPR (

دا وښودل شول چې د نومونو لرې کول د نوم نه ورکولو په توګه ناکام کیږي. که څه هم مثالونه په زړه پوري قضیې دي ، هر یو د بیا پیژندنې سادګي ښیې او د افرادو په محرمیت باندې احتمالي منفي اغیز.

په پایله کې ، ستاسو د ډیټاسټ څخه د نومونو حذف کول د نامعلوم ډیټا پایله نلري. لدې امله ، موږ غوره یو چې د دواړه شرایطو په تبادله توګه کارولو څخه مخنیوی وکړو. زه په کلکه امید لرم چې تاسو به د نوم نه ښودلو لپاره دا طریقه پلي نه کړئ. او ، که تاسو لاهم ترسره کوئ ، ډاډ ترلاسه کړئ چې تاسو او ستاسو ټیم د محرمیت خطرونه په بشپړ ډول پیژنئ ، او اجازه ورکړل شوې چې د اغیزمنو اشخاصو په استازیتوب دا خطرونه ومني.

د خلکو موسکا

ډاټا مصنوعي ده، مګر زموږ ټیم ریښتیا دی!

له سنتو سره اړیکه ونیسئ او زموږ یو متخصص به د مصنوعي معلوماتو ارزښت سپړلو لپاره د ر light ا سرعت سره تاسو سره اړیکه ونیسي!

  • ډي رینسل ، ج ګانټز ، جان ریډینګ. د نړۍ ډیجیټل کول له څنډې څخه تر کور پورې ، د ډیټا عمر 2025 ، 2018
  • L. سوینی. k-نوم نه ښودل: د محرمیت ساتنې لپاره ماډل. د ناڅرګندتیا ، ګډوډۍ او د پوهې پر بنسټ سیسټمونو باندې نړیوال ژورنال ، 10 (5) ، 2002: 557-570
  • L. سوینی. ساده ډیموګرافیک اکثرا خلک په ځانګړي ډول پیژني. کارنیګي میلون پوهنتون ، د معلوماتو محرمیت کاري پا 3.ه 2000. پیټسبورګ XNUMX
  • پی. سمرتی. په مایکرو ډیټا ریلیز کې د ځواب ورکونکو هویت خوندي کول. د پوهې او ډیټا انجینرۍ باندې د IEEE لیږدونه ، 13 (6) ، 2001: 1010-1027
  • اتکوکر. د ستورو سره سواری: د NYC ټیکسیب ډیټسیټ کې د مسافر محرمیت ، 2014
  • ناریانان ، اې. ، او شماتیکوف ، وی (2008). د لوی سپار ډیټاسیټونو قوي بې نومه کول. په پروسو کې-د امنیت او محرمیت په اړه د 2008 IEEE سمپوزیم ، SP (pp. 111-125)
  • د ډیټا محافظت عمومي مقررات (GDPR) ، تلاوت 26 ، نامعلوم معلوماتو ته د تطبیق وړ ندي