சின்தோவால் உருவாக்கப்பட்ட செயற்கைத் தரவு, SAS இன் தரவு வல்லுனர்களால் வெளிப்புற மற்றும் புறநிலைக் கண்ணோட்டத்தில் மதிப்பிடப்பட்டு, சரிபார்க்கப்பட்டு அங்கீகரிக்கப்படுகிறது.
சின்தோ தனது பயனர்களுக்கு மேம்பட்ட தர உத்தரவாத அறிக்கையை வழங்குவதில் பெருமிதம் கொள்கிறது என்றாலும், தொழில்துறை தலைவர்களிடமிருந்து எங்கள் செயற்கைத் தரவை வெளிப்புற மற்றும் புறநிலை மதிப்பீட்டின் முக்கியத்துவத்தையும் நாங்கள் புரிந்துகொள்கிறோம். அதனால்தான், எங்கள் செயற்கைத் தரவை மதிப்பிட, பகுப்பாய்வுகளில் முன்னணியில் உள்ள SAS உடன் நாங்கள் ஒத்துழைக்கிறோம்.
SAS ஆனது தரவு-துல்லியம், தனியுரிமைப் பாதுகாப்பு மற்றும் சின்தோவின் AI-உருவாக்கப்பட்ட செயற்கைத் தரவுகளின் அசல் தரவுகளுடன் ஒப்பிடுகையில் பயன்படுத்தக்கூடிய பல்வேறு முழுமையான மதிப்பீடுகளை நடத்துகிறது. முடிவாக, SAS சின்தோவின் செயற்கைத் தரவை அசல் தரவுகளுடன் ஒப்பிடுகையில் துல்லியமானது, பாதுகாப்பானது மற்றும் பயன்படுத்தக்கூடியது என மதிப்பிட்டு ஒப்புதல் அளித்தது.
"சர்ர்ன்" முன்கணிப்புக்காகப் பயன்படுத்தப்படும் டெலிகாம் தரவை இலக்குத் தரவாகப் பயன்படுத்தினோம். மதிப்பீட்டின் இலக்கானது, செயற்கைத் தரவைப் பயன்படுத்தி பல்வேறு கர்ன் முன்கணிப்பு மாதிரிகளைப் பயிற்றுவிப்பதற்கும் ஒவ்வொரு மாதிரியின் செயல்திறனை மதிப்பிடுவதற்கும் ஆகும். கர்ன் முன்கணிப்பு ஒரு வகைப்பாடு பணியாக இருப்பதால், SAS கணிப்புகளைச் செய்ய பிரபலமான வகைப்பாடு மாதிரிகளைத் தேர்ந்தெடுத்தது:
செயற்கைத் தரவை உருவாக்கும் முன், எஸ்ஏஎஸ் தொலைத்தொடர்பு தரவுத்தொகுப்பை ஒரு ரயில் தொகுப்பாக (மாடல்களைப் பயிற்றுவிப்பதற்காக) மற்றும் ஹோல்ட்அவுட் தொகுப்பாக (மாடல்களை ஸ்கோரிங் செய்வதற்கு) தோராயமாகப் பிரித்தது. புதிய தரவுகளுக்குப் பயன்படுத்தப்படும்போது, வகைப்பாடு மாதிரி எவ்வளவு சிறப்பாகச் செயல்படும் என்பதை ஒரு பக்கச்சார்பற்ற மதிப்பீட்டை ஸ்கோரிங் செய்ய தனித்தனியாக வைத்திருப்பது அனுமதிக்கிறது.
ரயில் தொகுப்பை உள்ளீடாகப் பயன்படுத்தி, சின்த்தோ அதன் சின்தோ எஞ்சினைப் பயன்படுத்தி ஒரு செயற்கை தரவுத்தொகுப்பை உருவாக்கியது. தரப்படுத்தலுக்காக, ஒரு குறிப்பிட்ட வரம்பை (கே-அநாமதேயத்தின்) அடைய பல்வேறு அநாமதேய நுட்பங்களைப் பயன்படுத்திய பிறகு, SAS ரயில் தொகுப்பின் அநாமதேய பதிப்பையும் உருவாக்கியது. முந்தைய படிகள் நான்கு தரவுத்தொகுப்புகளாக விளைந்தன:
தரவுத்தொகுப்புகள் 1, 3 மற்றும் 4 ஆகியவை ஒவ்வொரு வகைப்பாடு மாதிரியைப் பயிற்றுவிக்கப் பயன்படுத்தப்பட்டன, இதன் விளைவாக 12 (3 x 4) பயிற்சியளிக்கப்பட்ட மாதிரிகள் கிடைத்தன. எஸ்ஏஎஸ் அதன்பின்னர் ஒவ்வொரு மாதிரியின் துல்லியத்தையும் வாடிக்கையாளர் குழப்பத்தின் கணிப்பிற்கு அளவிடுவதற்கு ஹோல்ட்அவுட் தரவுத்தொகுப்பைப் பயன்படுத்தியது.
SAS ஆனது தரவு-துல்லியம், தனியுரிமைப் பாதுகாப்பு மற்றும் சின்தோவின் AI-உருவாக்கப்பட்ட செயற்கைத் தரவுகளின் அசல் தரவுகளுடன் ஒப்பிடுகையில் பயன்படுத்தக்கூடிய பல்வேறு முழுமையான மதிப்பீடுகளை நடத்துகிறது. முடிவாக, SAS சின்தோவின் செயற்கைத் தரவை அசல் தரவுகளுடன் ஒப்பிடுகையில் துல்லியமானது, பாதுகாப்பானது மற்றும் பயன்படுத்தக்கூடியது என மதிப்பிட்டு ஒப்புதல் அளித்தது.
சின்தோவில் இருந்து செயற்கைத் தரவு அடிப்படை வடிவங்களுக்கு மட்டுமல்ல, மேம்பட்ட பகுப்பாய்வு பணிகளுக்குத் தேவையான ஆழமான 'மறைக்கப்பட்ட' புள்ளிவிவர வடிவங்களையும் கைப்பற்றுகிறது. பிந்தையது பார் விளக்கப்படத்தில் நிரூபிக்கப்பட்டுள்ளது, இது செயற்கை தரவு மற்றும் அசல் தரவுகளில் பயிற்சியளிக்கப்பட்ட மாதிரிகள் மீது பயிற்சியளிக்கப்பட்ட மாதிரிகளின் துல்லியம் ஒத்ததாக இருப்பதைக் குறிக்கிறது. எனவே, மாதிரிகளின் உண்மையான பயிற்சிக்கு செயற்கை தரவு பயன்படுத்தப்படலாம். அசல் தரவுகளுடன் ஒப்பிடும்போது செயற்கைத் தரவுகளின் அல்காரிதம்களால் தேர்ந்தெடுக்கப்பட்ட உள்ளீடுகள் மற்றும் மாறி முக்கியத்துவம் மிகவும் ஒத்ததாக இருந்தது. எனவே, உண்மையான உணர்திறன் தரவைப் பயன்படுத்துவதற்கு மாற்றாக செயற்கைத் தரவுகளில் மாடலிங் செயல்முறையைச் செய்யலாம் என்று முடிவு செய்யப்பட்டுள்ளது.
கிளாசிக் அநாமதேய நுட்பங்கள் பொதுவாக தனிநபர்களைக் கண்டுபிடிப்பதைத் தடுக்கும் வகையில் அசல் தரவைக் கையாளுகின்றன. அவர்கள் தரவைக் கையாளுகிறார்கள், அதன் மூலம் செயல்பாட்டில் தரவை அழிக்கிறார்கள். நீங்கள் எந்த அளவுக்கு அநாமதேயமாக்குகிறீர்களோ, அவ்வளவு சிறப்பாக உங்கள் தரவு பாதுகாக்கப்படுகிறது, ஆனால் உங்கள் தரவு அழிக்கப்படும். இது குறிப்பாக AI மற்றும் மாடலிங் பணிகளுக்கு பேரழிவை ஏற்படுத்துகிறது, அங்கு "முன்கணிப்பு சக்தி" இன்றியமையாதது, ஏனெனில் மோசமான தரமான தரவு AI மாதிரியிலிருந்து மோசமான நுண்ணறிவுகளை ஏற்படுத்தும். SAS இதை நிரூபித்தது, வளைவின் கீழ் உள்ள பகுதி (AUC*) 0.5 க்கு அருகில் உள்ளது, அநாமதேய தரவுகளில் பயிற்சி பெற்ற மாதிரிகள் மிகவும் மோசமாக செயல்படுகின்றன என்பதை நிரூபிக்கிறது.
மாறிகளுக்கு இடையிலான தொடர்புகள் மற்றும் உறவுகள் செயற்கைத் தரவுகளில் துல்லியமாகப் பாதுகாக்கப்படுகின்றன.
வளைவின் கீழ் பகுதி (AUC), மாதிரி செயல்திறனை அளவிடுவதற்கான மெட்ரிக் நிலையானது.
மேலும், ஒரு மாதிரியில் மாறிகளின் முன்கணிப்பு சக்தியைக் குறிக்கும் மாறி முக்கியத்துவம், செயற்கைத் தரவை அசல் தரவுத்தொகுப்புடன் ஒப்பிடும் போது அப்படியே இருந்தது.
SAS இன் இந்த அவதானிப்புகளின் அடிப்படையில் மற்றும் SAS Viya ஐப் பயன்படுத்துவதன் மூலம், Syntho Engine மூலம் உருவாக்கப்பட்ட செயற்கைத் தரவு உண்மையில் தரத்தின் அடிப்படையில் உண்மையான தரவுகளுக்கு இணையாக இருக்கும் என்று நாம் நம்பிக்கையுடன் முடிவு செய்யலாம். இது மாதிரி உருவாக்கத்திற்கான செயற்கைத் தரவைப் பயன்படுத்துவதை உறுதிப்படுத்துகிறது, செயற்கைத் தரவுகளுடன் மேம்பட்ட பகுப்பாய்வுகளுக்கு வழி வகுக்கிறது.