தரவு அகழ்தல்
அமெரிக்க அரசியலமைப்பின் விதிகள் எத்தனை? / From Wikipedia, the free encyclopedia
தரவு அகழ்தல் (Data mining) என்பது எந்திரக் கற்றல், புள்ளியியல், தரவுத்தளம் ஆகிய அமைப்புகளின் குறுக்குவெட்டில் உள்ள முறைகளை உள்ளடக்கிய பெரிய தரவுத் தொகுப்புகளில் உள்ள பாணிகளைப் பிரித்தெடுத்துக் கண்டுபிடிக்கும் செயல்முறையாகும். தரவு அகழ்தல், எந்திர கற்றல், புள்ளியியல், தரவுத்தள அமைப்புகளை அமைக்கிறது[1] தரவு அகழ்தல் என்பது கணினி அறிவியல், புள்ளியியலின் ஓர் இடைநிலை துணைத் துறையாகும் , இது தரவுத் தொகுப்பிலிருந்து தகவல்களைப் பிரித்தெடுப்பதற்கும் , மேலும் பயன்படுத்த தகவல்களை புரிந்துகொள்ளக்கூடிய கட்டமைப்பாக மாற்றுவதற்குமான ஒட்டுமொத்த குறிக்கோளுடன் செயல்படுகிறது.[1][2][3][4] தரவு அகழ்தல் என்பது தரவுத்தளங்களில் அறிவு கண்டுபிடிப்பு செயல்முறை அல்லது அதன் பகுப்பாய்வுப் படியாகும். [5] மூலப் பகுப்பாய்வுப் படிகளைத் தவிர , தரவுத்தள, தரவு மேலாண்மையின் கூறுகள், தரவு முன் செயலாக்கம், படிமம், உய்த்துணர்வுக் கருதல்கள், சுவைமை அளவுகள், சிக்கலான கருதல்கள், கண்டுபிடிக்கப்பட்ட கட்டமைப்புகளின் பிந்தைய செயலாக்கம், காட்சிப்படுத்தல், இணையப் புதுப்பித்தல் போன்றவற்றை உள்ளடக்கியது -. [1]
" தரவு அகழ்தல் " என்ற சொல் ஒரு தவறான பெயராகும் , ஏனெனில் இதன் குறிக்கோள் பெரிய அளவிலான தரவுகளிலிருந்து பாணிகளையும் அறிவையும் பிரித்தெடுப்பதே தவிர , தரவைப் பிரித்தெடுப்பது அல்ல. இது ஒரு முதன்மைச் சொல்லாகும். மேலும் இது எந்தவொரு பெரிய அளவிலான தரவு அல்லது தகவல் செயலாக்கத்திற்கும் ( திரட்டல், தேக்கல், பகுப்பாய்வு, புள்ளியியல்) மேலும், செயற்கை நுண்ணறிவு (எ. கா. இயந்திர கற்றல், வணிக நுண்ணறிவு) உள்ளிட்ட கணினி முடிவு ஏற்பு அமைப்பின் எந்தவொரு பயன்பாட்டிற்கும் அடிக்கடி பயன்படுத்தப்படுகிறது.[6] (இது பெரும்பாலும் எந்திரக் கற்றல் பொருட்களை உள்ளடக்கியது) இது நடைமுறை எந்திரக் கற்றல் என்ற புத்தகம் முதலில் வெளிவந்ததும் பெயரிடப்பட்டது. தரவு அகழ்தல் என்ற சொல் சந்தைப்படுத்தல் காரணங்களுக்காக மட்டுமே சேர்க்கப்பட்டது. [7] பெரிய அளவிலான தரவு பகுப்பாய்வு அல்லது உண்மையான முறைகளைக் குறிப்பிடும்போது, செயற்கை நுண்ணறிவு, எந்திர கற்றல் ஆகியனவே மிகவும் பொருத்தமானவை.
உண்மையான தரவு அகழ்தல் பணி என்பது , முன்னர் அறியப்படாத தரவுக் குழுக்கள் (கொத்துப் பகுப்பாய்வு), இயல்பற்ற, பதிவுகள் (ஒழுங்கின்மை கண்டறிதல்), சார்புகள் (இணைவு விதி) போன்ற சுவையான பணிகளைப் பிரித்தெடுக்க, பேரளவிலான தரவுகளின் அரைத் தானியங்கி அல்லது தானியங்கி பகுப்பாய்வு ஆகும். இது பொதுவாக இடஞ்சார்ந்த சுட்டுகள் போன்ற தரவுத்தள நுட்பங்களைப் பயன்படுத்துவதை உள்ளடக்கியது. இந்தப் பாணிகள் பின்னர் உள்ளீட்டு தரவுகளின் சுருக்கமாகப் பார்க்கப்படலாம். மேலும் பகுப்பாய்வில் பயன்படுத்தப்படலாம். அல்லது எடுத்துக்காட்டாக எந்திர கற்றல், முன்கணிப்புப் பகுப்பாய்வுகளில் பயன்படுத்தப்படலாம். எடுத்துக்காட்டாக , தரவு அகழ்தல் நடவடிக்கை தரவுகளில் பல குழுக்களை அடையாளம் காணலாம் , பின்னர் அவை ஒரு முடிவலேற்பு அமைப்பு வழி மிகவும் துல்லியமான முன்கணிப்பு முடிவுகளைப் பெற பயன்படுத்தப்படலாம். தரவு திரட்டலோ தரவு ஆயத்தமோ அல்லது முடிவோ , விளக்கமோ அறிக்கையோ தரவு அகழ்தல் நடவடிக்கையின் ஒரு பகுதியல்ல. இருப்பினும் அவை கூடுதல் படிகளாக ஒட்டுமொத்த KDD செயல்முறையைச் சேர்ந்தவை.
தரவு பகுப்பாய்விற்கும் தரவு அகழ்வுக்கும் உள்ள வேறுபாடு என்னவென்றால் , தரவு பகுப்பாய்வில் படிமங்கள், கருதுகோள்களைச் சோதிக்க தரவு பகுப்பாய்வு பயன்படுத்தப்படுகிறது. எ. கா. தரவுகளின் அளவைப் பொருட்படுத்தாமல் சந்தைப்படுத்தல் பரப்புரையின் செயல்திறனைப் பகுப்பாய்வு செய்கிறது. இதற்கு மாறாக , தரவு அகழ்தல் எந்திரக் கற்றல், புள்ளியியல் படிமங்களைப் பயன்படுத்தி பேரளவிலான தரவுகளில் இரகசியமாக உள்ள அல்லது மறைக்கப்பட்ட பாணிகளைக் கண்டறிகிறது.[8]
தரவு உளவும் தரவு உள்விவரிப்பும் இரண்டுமே பெரிய மக்கள்தொகை தரவுத் தொகுப்பின் பகுதிகளைப் படிமமாக்கத்துக்குப் பயன்படும் தரவு அகழ்தல் முறைகளைப் பயன்படுத்துவதையே குறிக்கின்றன ( இவை கண்டுபிடிக்கப்பட்ட எந்தவொரு பாணிகளின் செல்லுபடியாகும் தன்மை பற்றியும் நம்பகமான புள்ளியியல் உய்த்துணர்வுகள் செய்யப்படுவதற்கு மிகவும் சிறிய அளவில் பயன்படுத்தலாம்). தரவு அகழாய்வு, தரவு மீன்பிடி, தரவு உளவு இருப்பினும் , இந்த முறைகள் பெருந்தரவு மக்கள்தொகைக்கான பெருந்தரவுச் செய்முறைகளைச் செய்ய, புதிய கருதுகோள்களை உருவாக்குவதில் பயன்படலாம்.