ما هي البيانات التركيبية؟

بيانات تركيبية مكثفة

 

 

المُقدّمة

ما هي البيانات التركيبية؟

الجواب بسيط نسبيا. في حين يتم جمع البيانات الأصلية في جميع تفاعلاتك مع أشخاص حقيقيين (مثل العملاء والمرضى والموظفين وما إلى ذلك) وعبر جميع العمليات الداخلية الخاصة بك ، يتم إنشاء البيانات التركيبية بواسطة خوارزمية الكمبيوتر. تُنشئ خوارزمية الكمبيوتر هذه نقاط بيانات جديدة ومصطنعة تمامًا.

حل تحديات خصوصية البيانات

تتكون البيانات المُنشأة صناعياً من نقاط بيانات جديدة تمامًا ومصطنعة بدون علاقات فردية بالبيانات الأصلية. وبالتالي ، لا يمكن تتبع أي من نقاط البيانات التركيبية أو عكسها هندسيًا إلى البيانات الأصلية. نتيجةً لذلك ، تُعفى البيانات التركيبية من لوائح الخصوصية ، مثل القانون العام لحماية البيانات (GDPR) وتعمل كحل لحل تحديات خصوصية البيانات والتغلب عليها.

زيادة ومحاكاة

يسمح الجانب التوليدي لتوليد البيانات التركيبية بزيادة ومحاكاة بيانات جديدة تمامًا. يعمل هذا كحل عندما لا يكون لديك بيانات كافية (ندرة البيانات) ، أو عندما ترغب في رفع عينة من الحالات الطرفية أو عندما لا يكون لديك بيانات بعد.

هنا ، ينصب تركيز Syntho على البيانات المنظمة (البيانات المنسقة في جداول تحتوي على صفوف وأعمدة ، كما ترى في أوراق Excel) ، لكننا نرغب دائمًا في توضيح مفهوم البيانات التركيبية عبر الصور ، لأنها أكثر جاذبية.

أنواع البيانات التركيبية

توجد ثلاثة أنواع من البيانات التركيبية داخل مظلة البيانات التركيبية. هذه الأنواع الثلاثة من البيانات التركيبية هي: البيانات الوهمية ، والبيانات التركيبية المُنشأة على أساس القواعد ، والبيانات التركيبية الناتجة عن الذكاء الاصطناعي (AI). نشرح باختصار الأنواع الثلاثة المختلفة للبيانات التركيبية.

بيانات وهمية / بيانات وهمية

البيانات الوهمية هي بيانات يتم إنشاؤها عشوائيًا (على سبيل المثال بواسطة مولد بيانات وهمي).

وبالتالي ، لا يتم حفظ الخصائص والعلاقات والأنماط الإحصائية الموجودة في البيانات الأصلية والتقاطها وإعادة إنتاجها في البيانات الوهمية التي تم إنشاؤها. ومن ثم ، فإن تمثيل البيانات الوهمية / البيانات الوهمية ضئيل للغاية مقارنة بالبيانات الأصلية.

  • متى تستخدمه: لاستبدال المعرفات المباشرة (PII) أو عندما لا يكون لديك بيانات (حتى الآن) ولا ترغب في إهدار الوقت والطاقة في تحديد القواعد.

البيانات التركيبية التي تم إنشاؤها على أساس القواعد

البيانات التركيبية المستندة إلى القواعد هي بيانات تركيبية يتم إنشاؤها بواسطة مجموعة محددة مسبقًا من القواعد. من الأمثلة على تلك القواعد المحددة مسبقًا أنك ترغب في الحصول على بيانات تركيبية بحد أدنى معين للقيمة أو الحد الأقصى للقيمة أو متوسط ​​القيمة. يجب تحديد أي من الخصائص والعلاقات والأنماط الإحصائية ، التي ترغب في إعادة إنتاجها في البيانات التركيبية التي تم إنشاؤها على أساس القواعد ، مسبقًا.

وبالتالي ، ستكون جودة البيانات جيدة مثل مجموعة القواعد المحددة مسبقًا. ينتج عن هذا تحديات عندما تكون جودة البيانات العالية جوهرية. أولاً ، يمكن للمرء تحديد مجموعة محدودة فقط من القواعد ليتم التقاطها في البيانات التركيبية. بالإضافة إلى ذلك ، عادةً ما ينتج عن إعداد قواعد متعددة قواعد متداخلة ومتضاربة. علاوة على ذلك ، لن تغطي بالكامل جميع القواعد ذات الصلة. علاوة على ذلك ، قد تكون هناك قواعد ذات صلة لا تعرفها حتى. وأخيرًا (ولا تنسى) ، سيستغرق هذا الكثير من الوقت والطاقة مما ينتج عنه حل غير فعال.

  • متى تستخدمه: عندما لا يكون لديك بيانات (حتى الآن)

البيانات التركيبية الناتجة عن الذكاء الاصطناعي (AI)

كما تتوقع من الاسم ، فإن البيانات التركيبية التي يتم إنشاؤها بواسطة الذكاء الاصطناعي (AI) هي بيانات تركيبية تم إنشاؤها بواسطة خوارزمية الذكاء الاصطناعي (AI). يتم تدريب نموذج الذكاء الاصطناعي على البيانات الأصلية لمعرفة جميع الخصائص والعلاقات والأنماط الإحصائية. بعد ذلك ، تكون خوارزمية الذكاء الاصطناعي هذه قادرة على إنشاء نقاط بيانات جديدة تمامًا ونماذج نقاط البيانات الجديدة تلك بطريقة تعيد إنتاج الخصائص والعلاقات والأنماط الإحصائية من مجموعة البيانات الأصلية. هذا ما نسميه توأم البيانات التركيبية.

يحاكي نموذج الذكاء الاصطناعي البيانات الأصلية لإنشاء توائم بيانات تركيبية يمكن استخدامها كما لو كانت بيانات أصلية. يؤدي هذا إلى فتح العديد من حالات الاستخدام حيث يمكن استخدام البيانات التركيبية التي تم إنشاؤها بواسطة الذكاء الاصطناعي كبديل لاستخدام البيانات الأصلية (الحساسة) ، مثل استخدام البيانات الاصطناعية التي تم إنشاؤها بواسطة الذكاء الاصطناعي مثل بيانات الاختبار أو البيانات التجريبية أو للتحليلات.

تصور كيف يتم إنشاء البيانات التركيبية

بالمقارنة مع البيانات التركيبية التي تم إنشاؤها على أساس القواعد: بدلاً من دراسة وتحديد القواعد ذات الصلة ، تقوم خوارزمية الذكاء الاصطناعي بذلك تلقائيًا نيابة عنك. هنا ، لن يتم تغطية الخصائص والعلاقات والأنماط الإحصائية التي تعرفها فحسب ، بل سيتم أيضًا تغطية الخصائص والعلاقات والأنماط الإحصائية التي لم تكن على دراية بها.

  • متى تستخدمه: عندما يكون لديك (بعض) البيانات كمدخلات لتقليد أو لاستخدامها كنقطة بداية لتوليد البيانات الذكية وميزات التعزيز

ما نوع البيانات التركيبية التي يجب استخدامها؟

بناءً على حالة الاستخدام الخاصة بك ، يُنصح بمزيج من البيانات الوهمية / البيانات الوهمية أو البيانات التركيبية المستندة إلى القواعد أو البيانات التركيبية الناتجة عن الذكاء الاصطناعي (AI). توفر لك هذه النظرة العامة أول إشارة إلى نوع البيانات التركيبية التي يجب استخدامها. نظرًا لأن Syntho يدعمها جميعًا ، فلا تتردد في الاتصال بخبرائنا للتعمق في حالة استخدامك معنا.

يعرض هذا الرسم البياني أنواعًا مختلفة من البيانات التركيبية

غطاء دليل سينثو

احفظ دليل البيانات التركيبية الآن!