וואָס איז סינטעטיש דאַטן?

א קראַך קורס סינטעטיש דאַטן

 

 

הקדמה

וואָס איז סינטעטיש דאַטן?

דער ענטפער איז לעפיערעך פּשוט. כוועראַז אָריגינעל דאַטן זענען געזאמלט אין אַלע דיין ינטעראַקשאַנז מיט פאַקטיש מענטשן (למשל קלייאַנץ, פּאַטיענץ, עמפּלוייז אאז"ו ו) און דורך אַלע דיין ינערלעך פּראַסעסאַז, סינטעטיש דאַטן זענען דזשענערייטאַד דורך אַ קאָמפּיוטער אַלגערידאַם. דער קאָמפּיוטער אַלגערידאַם דזשענערייץ גאָר נייַע און קינסטלעך דאַטאַפּאָינץ.

סאָלווע דאַטן פּריוואַטקייט טשאַלאַנדזשיז

סינטעטיש דזשענערייטאַד דאַטן באשטייט פון גאָר נייַע און קינסטלעך דאַטאַפּאָינץ מיט קיין איין-צו-איינער באַציונגען צו דער אָריגינעל דאַטן. דערפאר, קיינער פון די סינטעטיש דאַטאַפּאָינץ קענען זיין טרייסט צוריק אָדער פאַרקערט ענדזשאַנירד צו אָריגינעל דאַטן. ווי אַ רעזולטאַט, סינטעטיש דאַטן זענען פּאָטער פון פּריוואַטקייט רעגיאַליישאַנז, אַזאַ ווי די GDPR און דינען ווי אַ לייזונג צו סאָלווע און באַקומען דאַטן-פּריוואַטקייט טשאַלאַנדזשיז.

פאַרגרעסערן און סימולירן

די דזשענעראַטיוו אַספּעקט פון סינטעטיש דאַטן דור אַלאַוז צו פאַרגרעסערן און סימולירן גאָר נייַע דאַטן. דעם פאַנגקשאַנז ווי אַ לייזונג ווען איר האָבן ניט גענוג דאַטן (דאַטאַ יאַקרעס), איר ווילן צו ויסשעפּן ברעג קאַסעס אָדער ווען איר טאָן ניט האָבן דאַטן נאָך.

דאָ, דער פאָקוס פון סינטהאָ איז סטראַקטשערד דאַטן (דאַטן פאָרמאַטטעד אין טישן מיט ראָוז און שפאלטן, ווי איר זען אין עקססעל שיץ), אָבער מיר שטענדיק ווי צו אילוסטרירן דעם באַגריף פון סינטעטיש דאַטן דורך בילדער, ווייַל דאָס איז מער אַפּילינג.

טייפּס פון סינטעטיש דאַטן

דריי טייפּס פון סינטעטיש דאַטן עקסיסטירן אין די סינטעטיש דאַטן שירעם. די 3 טייפּס פון סינטעטיש דאַטן זענען: דאַמי דאַטן, הערשן-באזירט דזשענערייטאַד סינטעטיש דאַטן און סינטעטיש דאַטן דזשענערייטאַד דורך קינסטלעך סייכל (AI). מיר באַלד דערקלערן וואָס די 3 פאַרשידענע טייפּס פון סינטעטיש דאַטן זענען.

דאַמי דאַטן / רייצנ דאַטן

דאַמי דאַטן זענען ראַנדאַמלי דזשענערייטאַד דאַטן (למשל דורך אַ רייצנ דאַטן גענעראַטאָר).

דעריבער, קעראַקטעריסטיקס, באציונגען און סטאַטיסטיש פּאַטערנז וואָס זענען אין דער אָריגינעל דאַטן זענען נישט אפגעהיט, קאַפּטשערד און ריפּראַדוסט אין די דזשענערייטאַד באָק דאַטן. דערפֿאַר, די רעפּריזענאַטיוונעסס פון דאַמי דאַטן / רייצנ דאַטן איז מינימאַל אין פאַרגלייַך צו דער אָריגינעל דאַטן.

  • ווען צו נוצן עס: צו פאַרבייַטן דירעקט ידענטיפיערס (PII) אָדער ווען איר טאָן ניט האָבן דאַטן (נאָך) און טאָן נישט וועלן צו פאַרברענגען צייט און ענערגיע אויף דיפיינינג כּללים.

הערשן-באזירט דזשענערייטאַד סינטעטיש דאַטן

הערשן-באזירט דזשענערייטאַד סינטעטיש דאַטן זענען סינטעטיש דאַטן דזשענערייטאַד דורך אַ פאַר-דיפיינד גאַנג פון כּללים. ביישפילן פון די פאַר-דיפיינד כּללים קען זיין אַז איר וואָלט ווי צו האָבן סינטעטיש דאַטן מיט אַ זיכער מינימום ווערט, מאַקסימום ווערט אָדער דורכשניטלעך ווערט. קיין פון די קעראַקטעריסטיקס, באציונגען און סטאַטיסטיש פּאַטערנז וואָס איר וואָלט ווי צו האָבן ריפּראַדוסט אין די הערשן-באזירט דזשענערייטאַד סינטעטיש דאַטן, מוזן זיין פאַר-דיפיינד.

דעריבער, די דאַטן קוואַליטעט וועט זיין ווי גוט ווי די פאַר-דיפיינד גאַנג פון כּללים. דאָס רעזולטאטן אין טשאַלאַנדזשיז ווען הויך דאַטן קוואַליטעט איז פון די עסאַנס. ערשטער, איינער קענען דעפינירן בלויז אַ לימיטעד גאַנג פון כּללים צו זיין קאַפּטשערד אין די סינטעטיש דאַטן. אַדדיטיאָנאַללי, באַשטעטיקן קייפל כּללים וועט טיפּיקלי רעזולטאַט אין אָוווערלאַפּינג און קאַנפליקטינג כּללים. דערצו, איר וועט קיינמאָל גאָר דעקן אַלע באַטייַטיק כּללים. דערצו, עס קען זיין באַטייַטיק כּללים וואָס איר טאָן ניט אפילו וויסן. און לעסאָף (און ניט צו פאַרגעסן), דאָס וועט נעמען איר אַ פּלאַץ פון צייט און ענערגיע, ריזאַלטינג אין אַ ניט-עפעקטיוו לייזונג.

  • ווען צו נוצן עס: ווען איר טאָן ניט האָבן דאַטן (נאָך)

סינטעטיש דאַטן דזשענערייטאַד דורך קינסטלעך סייכל (AI)

ווי איר דערוואַרטן פון דעם נאָמען, סינטעטיש דאַטן דזשענערייטאַד דורך קינסטלעך סייכל (AI) זענען סינטעטיש דאַטן דזשענערייטאַד דורך אַ קינסטלעך סייכל (AI) אַלגערידאַם. דער אַי מאָדעל איז טריינד אויף דער אָריגינעל דאַטן צו לערנען אַלע קעראַקטעריסטיקס, באציונגען און סטאַטיסטיש פּאַטערנז. דערנאָכדעם, דער אַי אַלגערידאַם איז ביכולת צו דזשענערייט גאָר נייַע דאַטאַפּאָינץ און מאָדעלס די נייַע דאַטאַפּאָינץ אין אַזאַ אַ וועג אַז עס ריפּראַדוסיז די קעראַקטעריסטיקס, באציונגען און סטאַטיסטיש פּאַטערנז פֿון דער אָריגינעל דאַטאַבייס. דאָס איז וואָס מיר רופן אַ סינטעטיש דאַטן צווילינג.

דער אַי מאָדעל מימיקס אָריגינעל דאַטן צו דזשענערייט סינטעטיש דאַטן צווילינג וואָס קענען זיין געוויינט ווי אויב עס איז אָריגינעל דאַטן. דאָס ופשליסן פאַרשידן נוצן קאַסעס ווען די יי דזשענערייטאַד סינטעטיש דאַטן קענען זיין געוויינט ווי אָלטערנאַטיוו פֿאַר ניצן אָריגינעל (שפּירעוודיק) דאַטן, אַזאַ ווי די נוצן פון אַי דזשענערייטאַד סינטעטיש דאַטן ווי פּרובירן דאַטן, דעמאָ דאַטן אָדער אַנאַליטיקס.

א וויזשוואַלאַזיישאַן ווי סינטעטיש דאַטן איז באשאפן

אין פאַרגלייַך מיט הערשן-באזירט דזשענערייטאַד סינטעטיש דאַטן: אַנשטאָט פון איר לערנען און דעפינירן באַטייַטיק כּללים, די אַי אַלגערידאַם טוט דאָס אויטאָמאַטיש פֿאַר איר. דאָ, ניט בלויז קעראַקטעריסטיקס, באציונגען און סטאַטיסטיש פּאַטערנז וואָס איר זענט אַווער פון וועט זיין באדעקט, אויך קעראַקטעריסטיקס, באציונגען און סטאַטיסטיש פּאַטערנז וואָס איר זענט נישט אַווער פון וועט זיין באדעקט.

  • ווען צו נוצן עס: ווען איר האָבן (עטלעכע) דאַטן ווי אַרייַנשרייַב צו נאָכמאַכן אָדער צו נוצן ווי אַ סטאַרטינג פונט פֿאַר סמאַרט דאַטן דור און פאַרגרעסערן פֿעיִקייטן

וואָס טיפּ פון סינטעטיש דאַטן צו נוצן?

דעפּענדינג אויף דיין נוצן-פאַל, אַ קאָמבינאַציע פון ​​​​דאַמי דאַטן / רייצנ דאַטן, הערשן-באזירט דזשענערייטאַד סינטעטיש דאַטן אָדער סינטעטיש דאַטן דזשענערייטאַד דורך קינסטלעך סייכל (AI) איז אַדווייזד. דער איבערבליק גיט איר אַ ערשטער אָנווייַז פון וואָס טיפּ פון סינטעטיש דאַטן צו נוצן. ווי Syntho שטיצט אַלע פון ​​​​זיי, פילן פריי צו קאָנטאַקט אונדזער עקספּערץ צו דיפּדיוו דיין נוצן-פאַל מיט אונדז.

דעם טשאַרט גיט פאַרשידענע טייפּס פון סינטעטיש דאַטן

סינטהאָ פירער דעקן

היט דיין סינטעטיש דאַטן פירן איצט!