শীর্ষ প্রশ্ন
সময়রেখা
চ্যাট
প্রসঙ্গ

উপাত্ত খনন

বৃহদাকারের উপাত্ত সমষ্টিসমূহ থেকে যে গণনমূলক প্রক্রিয়াতে বিভিন্ন বিন্যাস আবিষ্কার করা হয় উইকিপিডিয়া থেকে, বিনামূল্যে একটি বিশ্বকোষ

উপাত্ত খনন
Remove ads

উপাত্ত খনন বা ইংরেজি পরিভাষায় ডাটা মাইনিং (ইংরেজি: data mining) পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[][][] এটি "উপাত্তাধারগুলিতে জ্ঞান আবিষ্কার" (নলেজ ডিসকভারি ইন ডেটাবেসেজ বা সংক্ষেপে কেডিডি)[]-এর একটি ধাপ।

Thumb
একটি উদাহরণ হলো ডেটা ড্রেজিংয়ের মাধ্যমে তৈরি করা তথ্য, যা পরিসংখ্যানবিদ টাইলার ভিজেন দ্বারা চালিত একটি বটের মাধ্যমে তৈরি হয়েছে। এটি দেখায় যে, স্পেলিং বি প্রতিযোগিতায় বিজয়ী সেরা শব্দের সাথে যুক্ত একটি সম্পর্ক রয়েছ এবং একই সাথে যুক্ত রয়েছে যুক্তরাষ্ট্রে বিষাক্ত মাকড়সার দ্বারা নিহত মানুষের সংখ্যা। এই ট্রেন্ডগুলোর মধ্যে সাদৃশ্যটি স্পষ্টভাবে একটি কাকতালীয় ঘটনা।

উপাত্ত খনন কৃত্রিম বুদ্ধিমত্তা, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউটিং বা পরিগণন কর্মকাণ্ড যার মাধ্যমে বিশালাকার উপাত্ত সংকলন (ডাটা সেট) থেকে নির্দিষ্ট বৈশিষ্টের উপাত্ত আবিষ্কার করা সম্ভব হয়। উপাত্ত খননের লক্ষ্য হল একটি উপাত্ত সংকলন থেকে নির্দিষ্ট বা কাংক্ষিত উপাত্ত খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেণীবদ্ধ ও উপস্থাপন করা।

উপাত্তাধারগুলিতে জ্ঞান আবিষ্কারের ধাপগুলো নিম্নরূপঃ

  • বাছাইকরণ (সিলেকশন)
  • প্রাক-প্রক্রিয়াজাতকরণ (প্রি-প্রোসেসিং)
  • রূপান্তর (ট্রান্সফরমেশন)
  • উপাত্ত খনন (ডাটা মাইনিং)
  • মূল্যায়ন (এভালুয়েশন)[]
Remove ads

উপাত্ত খননের অ্যালগরিদম বা পরিগণনা প্রক্রিয়া

  • শ্রেণীবদ্ধকরণ (ক্লাসিফিকেশন)

এই প্রক্রিয়ায় পূর্বের উপাত্ত বিশ্লেষণ করে ভবিষ্যতের উপাত্তের চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। সিদ্ধান্ত বৃক্ষ (ডিসিশন ট্রি), স্নায়বিক জাল [(নিউরাল নেটওয়ার্ক), ইত্যাদি প্রক্রিয়ায় সাধারণত উপাত্ত বিশ্লেষণ করা হয়।

  • গুচ্ছকরণ (ক্লাস্টারিং)

এই প্রক্রিয়ায় উপাত্তসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণীবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণীর উপাত্তগুলির মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দুইটি ভিন্ন শ্রেণীর উপাত্তগুলির মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা গুচ্ছকরণের উদ্দেশ্য।[]

  • সম্পর্কস্থাপন (অ্যাসোসিয়েশন)

এই প্রক্রিয়ায় পূর্বের কোন লিখিত নথিবিবণীতে (রেকর্ডে) যেসব উপাত্ত এসাথে অবস্থান করে তাদের মধ্যে সম্পর্কস্থাপন করা হয়।

  • অনুক্রম আবিষ্কার (সিকুয়েন্স ডিসকভারি)

এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে উপাত্ত শ্রেণীবদ্ধ করা হয়।[]

Remove ads

আরও দেখুন

তথ্যসূত্র

বহিঃসংযোগ

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads