শীর্ষ প্রশ্ন
সময়রেখা
চ্যাট
প্রসঙ্গ
উপাত্ত খনন
বৃহদাকারের উপাত্ত সমষ্টিসমূহ থেকে যে গণনমূলক প্রক্রিয়াতে বিভিন্ন বিন্যাস আবিষ্কার করা হয় উইকিপিডিয়া থেকে, বিনামূল্যে একটি বিশ্বকোষ
Remove ads
উপাত্ত খনন বা ইংরেজি পরিভাষায় ডাটা মাইনিং (ইংরেজি: data mining) পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[১][২][৩] এটি "উপাত্তাধারগুলিতে জ্ঞান আবিষ্কার" (নলেজ ডিসকভারি ইন ডেটাবেসেজ বা সংক্ষেপে কেডিডি)[৩]-এর একটি ধাপ।

উপাত্ত খনন কৃত্রিম বুদ্ধিমত্তা, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউটিং বা পরিগণন কর্মকাণ্ড যার মাধ্যমে বিশালাকার উপাত্ত সংকলন (ডাটা সেট) থেকে নির্দিষ্ট বৈশিষ্টের উপাত্ত আবিষ্কার করা সম্ভব হয়। উপাত্ত খননের লক্ষ্য হল একটি উপাত্ত সংকলন থেকে নির্দিষ্ট বা কাংক্ষিত উপাত্ত খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেণীবদ্ধ ও উপস্থাপন করা।
উপাত্তাধারগুলিতে জ্ঞান আবিষ্কারের ধাপগুলো নিম্নরূপঃ
- বাছাইকরণ (সিলেকশন)
- প্রাক-প্রক্রিয়াজাতকরণ (প্রি-প্রোসেসিং)
- রূপান্তর (ট্রান্সফরমেশন)
- উপাত্ত খনন (ডাটা মাইনিং)
- মূল্যায়ন (এভালুয়েশন)[৪]
Remove ads
উপাত্ত খননের অ্যালগরিদম বা পরিগণনা প্রক্রিয়া
- শ্রেণীবদ্ধকরণ (ক্লাসিফিকেশন)
এই প্রক্রিয়ায় পূর্বের উপাত্ত বিশ্লেষণ করে ভবিষ্যতের উপাত্তের চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। সিদ্ধান্ত বৃক্ষ (ডিসিশন ট্রি), স্নায়বিক জাল [(নিউরাল নেটওয়ার্ক), ইত্যাদি প্রক্রিয়ায় সাধারণত উপাত্ত বিশ্লেষণ করা হয়।
- গুচ্ছকরণ (ক্লাস্টারিং)
এই প্রক্রিয়ায় উপাত্তসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণীবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণীর উপাত্তগুলির মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দুইটি ভিন্ন শ্রেণীর উপাত্তগুলির মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা গুচ্ছকরণের উদ্দেশ্য।[৫]
- সম্পর্কস্থাপন (অ্যাসোসিয়েশন)
এই প্রক্রিয়ায় পূর্বের কোন লিখিত নথিবিবণীতে (রেকর্ডে) যেসব উপাত্ত এসাথে অবস্থান করে তাদের মধ্যে সম্পর্কস্থাপন করা হয়।
- অনুক্রম আবিষ্কার (সিকুয়েন্স ডিসকভারি)
এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে উপাত্ত শ্রেণীবদ্ধ করা হয়।[৪]
Remove ads
আরও দেখুন
তথ্যসূত্র
বহিঃসংযোগ
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads