أفضل الأسئلة
الجدول الزمني
الدردشة
السياق
علم البيانات
مجال متعدد التخصصات يستخدم الأساليب العلمية لتحليل البيانات واستخراج المعرفة من ويكيبيديا، الموسوعة الحرة
Remove ads
يُعدّ علم البيانات (بالإنجليزية: Data Science) من التخصصات متعددة المجالات التي تعتمد على الأساليب العلمية والخوارزميات والأنظمة لاستخراج المعرفة والأفكار من البيانات المنظمة وغير المنظمة. ويجمع هذا العلم بين تقنيات من الإحصاء، الرياضيات، علوم الحاسوب، بالإضافة إلى مجالات تطبيقية مثل الذكاء الاصطناعي وتعلم الآلة.
ظهر المصطلح بشكل واسع في أوائل القرن الحادي والعشرين مع تزايد حجم البيانات الضخمة والحاجة إلى أدوات فعّالة لتحليلها ودعم اتخاذ القرار في مجالات مثل التسويق، الطب، الاقتصاد، والهندسة.[1][2][3]
Remove ads
التاريخ

مصطلح «علم البيانات» (الذي استخدم في الأصل بالتبادل مع "Datalogy") موجود لأكثر من ثلاثين عاما، وكان يستخدم في البداية كبديل عن علوم الكمبيوتر من قبل بيتر ناور في عام 1960. حيث في عام 1974، نشر بيتر ناور مسح موجز لأساليب الكمبيوتر، والذي استخدم مصطلح «علم البيانات» بحرية في دراسته لطرق معالجة البيانات المعاصرة التي تستخدم في مجموعة واسعة من التطبيقات.
Remove ads
المهام الأساسية لعالم البيانات[4][5]
على الرغم من أن كل من محللي وعلماء البيانات يتشاركون العديد من الأهداف والمهام إلا أنه هناك بعض الاختلافات.
هذه قائمة قصيرة بأهم المهام والأهداف التي يعمل عليها
1-التنبؤ بقيم معينة بناءً على بيانات قديمة.
• التنبؤ بإجمالي الربح الذي سوف تحصل عليه الشركة خلال الشهر القادم.
• التنبؤ بعدد المستخدمين الجدد للتطبيق في شهر معين.
2-عمليات التصنيف | Classification
• تصنيف البريد الإلكتروني بأنه غير هام أو هام.
3-بناء أنظمة التوصية | Recommendation Systems
• عندما تقوم بعملية شراء لمنتج ما، سوف تلاحظ وجود قائمة تخبرك بمنتجات شبيه بالمنتج الذي اخترته.
• أنظمة التوصية في مواقع مشاهدة الأفلام.
4- الكشف عن الأنماط | Pattern Detection
•اكتشاف العلاقات بين البيانات الموجودة التي لا يمكن الكشف عنها بالطرق التقليدية.
5-التحليل الاستكشافي للبيانات | Exploratory Data Analysis
•إجراء بعض العمليات على البيانات لفهم طبيعتها والحصول على فكرة أولية عما تحتويه من معلومات.
6-قياس جودة أداء الخوارزميات وتحسين نتائجها.
Remove ads
الاختلافات الأساسية بين عالم البيانات ومحلل البيانات[4]
الملخص
السياق
- إن محلل البيانات يركز بشكل أساسي على معالجة وتحليل البيانات واستخراج معرفة منها تفيد الأعمال في تفسير الماضي والوقت الحاضر. أما عالم البيانات فيقوم بتطوير وبناء خوارزميات ونماذج لتحليل البيانات واستخراج معرفة منها تفيد في تفسير الماضي والحاضر، والتنبؤ بالمستقبل!
- محلل البيانات يقوم بالإجابة على أسئلة محددة طرحت من قبل أشخاص آخرين (معظم الأحيان). أما عالم البيانات يقوم باكتشاف وصياغة الأسئلة (متبعاً المنهج العلمي) التي تسعى إلى حل مشاكل غير منتبه إليها أو غير ظاهرة بعد.
- محلل البيانات عادةً ما يقوم باستخدام برامج وتطبيقات جاهزة لتساعده في جميع أعماله. أما عالم البيانات بالإضافة إلى استخدام الأدوات والبرامج، فهو قادر على بناء أنظمة أو تطبيقات خاصة به لتقوم بالعمل.[4][6]
مراحل عملية علم البيانات[4]
1-الحصول على البيانات المتعلقة بالموضوع الذي تريد أن تكتشفه أو المشكلة المراد حلها.
2-معالجة البيانات والتأكد من صحتها وخلوها من الأخطاء التي من الممكن أن تؤثر على النتائج.
3-القيام بالتحليل الاستكشافي للبيانات للحصول على نظرة شاملة عن البيانات المتعامل معها.
4-بناء، تطوير، وتطبيق الخوازميات والنماذج اللازمة لحل المشكلة والحصول على النتائج.
5-عرض النتائج النهائية على أصحاب القرار.
أقسام علم البيانات[7]
الملخص
السياق
اكتشاف وفهم البيانات
يهتم هذا القسم في اكتشاف المعرفة داخل البيانات. لتمكين أصحاب الأعمال من اتخاذ قرارات تحقق لهم فائدة أكبر.
حيث يعتمد بشكل كبير على علم الاحصاء (تحليل البيانات الكمي والنوعي).
على سبيل المثال تطبيق موبايل لبيع الملابس يعمل على أجهزة الأيفون والاندرويد.
البيانات (Data): أظهرت البيانات أنه خلال الشهر الماضي تم استخدام التطبيق من قبل 5000 مستخدم.
التحليلات (Analytics): يمكن استخدام التحليلات لإيجاد عدد المستخدمين الذين استعملوا التطبيق من خلال الايفون.
فهم التحليلات (Insights): من الممكن اكتشاف أن مستخدمي الايفون هم أقل احتمالاً للشراء عبر التطبيق بنسبة 40%.
الخطوة التالية تتمثل بمعرفة السبب وراء انخفاض نسبة التعاملات باستخدام اجهزة الايفون مقارنة بباقي الأجهزة.
هل يمكن أن يتعلق هذا الأمر بصعوبة وتعقيد واجهة استخدام التطبيق في الايفون؟
فإذا كان الأمر صحيحاً، فإن جعل واجهة الاستخدام بسيطة أكثر، سوف يرفع من احتمال عملية شراء المنتجات عبر المستخدمين الذين يملكون أيفون.
تطوير منتجات مرتبطة بالبيانات[7]
يستخدم هذا القسم البيانات الموجودة لدى الشركة، كمدخلات إلى الخوارزميات والنماذج التي يقوم ببنائها “عالم البيانات”. يعتمد هذا القسم بشكل كبير على معرفة الشخص بعلم الحاسوب وخوارزميات تعلم الآلة والذكاء الصناعي.
أمثلة
- Google Search عندما تقوم بالبحث عن شيء معين، فإن محرك البحث غوغل لا يقوم بعرض النتائج المتعلقة بهذه الكلمة فقط، بل يستخدم جميع البيانات التي يمكن الحصول عليها من المستخدم لعرض أفضل نتيجة ممكنة. النتائج سوف تتعلق بالأمور التي قمت بالبحث عنها سابقاً، بمكانك الجغرافي (في أي بلد أنت)، بتحليل الأمور التي تحبها. عمرك وجنسك، والعديد من الأمور الأخرى.
- Spell Checking حيث يقوم غوغل بمراقبة الكلمات التي يقوم المستخدم بالضغط عليها حتى يقوم بتحسين الخوارزمية الخاصة بتصحيح الأخطاء الإملائية.
- Gmail يقوم باستخدام خوارزمية معينة بتصنيف رسائل البريد الإلكتروني بين رسائل مهمة أو رسائل مزعجة.
- Netflix يعد استخدام نظم التوصية Recommendation systems من أحد أهم الأمور الموجودة في هذا المجال، حيث تقوم بالاعتماد على اهتمامات المستخدم ونمط الأفلام التي يشاهدها، والأفلام الأخيرة التي شاهدها وجنسه وعمره، والتقييمات التي وضعها على الأفلام بتوصية أفلام جديدة من الممكن أن تعجب المستخدم.
ادوات مرئية
- Plotly يوفر مجموعة غنية من مكتبات الرسوم البيانية العلمية التفاعلية..
- تابلو سوفتوير يصنع مجموعة متنوعة من البرامج المستخدمة لتصور البيانات.[8]
- باور بي آي iهي خدمة تحليلات أعمال مقدمة من مايكروسوفت..
- Qlik تنتج برامج مثل QlikView و Qlik Sense المستخدمة لتصور البيانات وذكاء الأعمال..
- AnyChart يوفر مكتبات JavaScript وأدوات أخرى لتصور البيانات في المخططات ولوحات المعلومات..
- Google Charts هي خدمة ويب تستند إلى JavaScript تم إنشاؤها ودعمها بواسطة Google لإنشاء مخططات رسومية. charts.
- Sisense يوفر واجهة أمامية لإنشاء تصورات البيانات بما في ذلك لوحات المعلومات والتقارير..
- Webix هي مجموعة أدوات لواجهة المستخدم تتضمن أدوات مخصصة لتصور المعلومات..
Remove ads
المراجع
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads