שאלות נפוצות
ציר זמן
צ'אט
פרספקטיבה
מדע הנתונים
תחום אינטרדיסציפלינרי שעוסק בהסקת מידע ומסקנות מגופי נתונים מוויקיפדיה, האנציקלופדיה החופשית
Remove ads
מדע הנתונים (באנגלית: Data Science; לעיתים נהגה גם בתעתיק מלועזית כ"דאטה סיינס" ושאר נגזרותיו למקצועות ולתחומים שונים[1]), הידוע גם כ"מדע מבוסס נתונים", הוא תחום בינתחומי של שיטות מדעיות, תהליכים, אלגוריתמים ומערכות לחלוקת ידע או הפקת תובנות מנתונים בצורות שונות, מובנות או בלתי מובנות, בדומה לכריית נתונים וללמידת מכונה.
מדע הנתונים הוא "הרעיון לאחד נתונים סטטיסטיים, ניתוח נתונים, למידת מכונה ושיטות נוספות הקשורות לתחום זה" כדי "להבין ולנתח תופעות בפועל" עם נתונים. מדע זה משתמש בטכניקות ובתאוריות הנמשכות מתחומים רבים בתחומי המתמטיקה, הסטטיסטיקה, מדעי המידע ומדעי המחשב, במיוחד מתת-התחומים של כריית נתונים, למידת מכונה, מאגרי מידע וויזואליזציה של מידע או אף של נתונים.
הזוכה בפרס טיורינג, ג'ים גריי, תיאר את מדע הנתונים כ"פרדיגמה רביעית של המדע" (אמפירי, תאורטי, חישובי, וכעת גם: מוּנע-נתונים) וטען כי "כל מה שקשור למדע משתנה עכשיו בזכות השפעת טכנולוגיית המידע".
לאחר שהמגזין "הרווארד ביזנס רוויו" (Harvard Business Review) כינה את מדע הנתונים כ"עבודה הסקסית ביותר של המאה ה-21", הפך המונח "מדע נתונים" מילת מפתח ומאז, הוא מוחל לעיתים קרובות על ניתוח עסקי, על שימוש שרירותי בנתונים, או משמש כמונח המציג באור חיובי את עבודת הניתוח הסטטיסטי.
בעוד שתוכניות אוניברסיטאיות רבות מציעות כיום תואר במדעי הנתונים, אין הסכמה על הגדרה או תוכני לימודים אחידים.
בזכות הפופולריות הרבה שקנה לעצמו מונח זה בימינו אלה, מושקעים מאמצי הסברה רבים כדי לקדמו וכדי לקדם את מקצוע מדען הנתונים (Data Scientist).
Remove ads
היסטוריה
במאמר שפורסם ב-2012, "מדעני נתונים: העבודה הסקסית ביותר של המאה ה-21"[2], דיג'יי פאטיל (DJ Patil) טוען כי טבע את המונח הזה ב-2008, בצוותא עם ג'ף המרבאכר (Jeff Hammerbacher), כדי להגדיר את עבודתם בלינקדין ובפייסבוק, בהתאמה. במאמר זה טען פאטיל, כי מדען הנתונים הוא "זן חדש", וכי "מחסור של מדעני נתונים הופך מגבלה רצינית בחלק מהמגזרים".
מדען נתונים
מדען נתונים (באנגלית: Data scientist), הוא אדם העוסק במשרה הקשורה לתחומי מדעי הנתונים (Data Science), ופעמים רבות זוהי גם הכשרתו האקדמית.
לרוב מדובר בתפקיד הדורש ידע והבנה בתחומים הבאים: מתמטיקה, ניתוחים סטטיסטים, שפות פיתוח, מסדי נתונים רלציונים, טכנולוגיות ומערכות מחשוב, כריית מידע, הדמיית נתונים. התפקיד מצריך יצירתיות וחדשנות, הבנה עסקית והשכלה אקדמאית.
תורת המידע אינה תחום חדש, אך עם עידן ה-Big Data החלה התעוררות ודרישה לתפקיד מדען נתונים. הסיבה היא שלמרות הטכנולוגיות המתקדמות והמידע הזמין ישנו קושי ליישם Big Data, הן בגלל מורכבות הפתרון והן בגלל מציאת השאלות הנכונות. האתגר האמיתי הוא לא איסוף המידע אלא ניתוחו בזמן מהיר שיאפשר לחברות להיות פרואקטיביות, יעילות ורווחיות. מכאן נולד הביקוש לתפקיד מדען נתונים: מישהו עם כישורים מיוחדים בסטטיסטיקה ותכנות כדי שיוכל לשאול את השאלות הנכונות על מנת להפיק תועלת מהמידע.
Remove ads
תחומי ידע נחוצים לצורך התמקצעות במדע הנתונים
ב-2010, הציע מדען הנתונים דרו קונוויי (אנ') דיאגרמת ון, המתארת את תחומי הידע והכישורים, הנחוצים לשם התמקצעות במדע הנתונים[3].
מנקודת מבטו של קונוויי, על מדען נתונים להיות בעל הכישורים ותחומי הידע הבאים:
- מיומנויות תכנותיות בכלל וידע בהאקינג בפרט.
דוגמה: ידע טכני ספציפי ב-Apache Mahout, ידע באלגוריתמים הקשורים ללמידת מכונה ועוד. - ידע במתמטיקה ובסטטיסטיקה.
ידע זה נחוץ לצורך ניתוח יכולות חישוביות[4]. - מומחיות מעמיקה בתחום[5].
מומחיות זו כוללת: הכרת התמונה הכוללת של תחום המומחיות, אינטואיציה; ידע בתחום דעת ספציפי (אנ')[6]; ניסיון פרקטי[7]; מיומנויות אנליטיות (אנ'), הדרושות לשם ניתוח (מלועזית: "אנליזה") של עובדות, כמו גם יכולת השלכה מפתרון בעיה אחת - לצורך פתרון בעיה אחרת.
הקשר לסטטיסטיקה
הפופולריות של המונח "מדע נתונים" התפוצצה בסביבות עסקיות ובאקדמיה, כפי שצוין על ידי קפיצה בפתיחת מקומות עבודה. עם זאת, אקדמאים רבים ועיתונאים לא רואים שום הבחנה בין מדע הנתונים לבין תחום הסטטיסטיקה. בכתבה במגזין "פורבס",[8] נכתב כי מדע הנתונים הוא מילה ללא הגדרה ברורה והיא פשוט החליפה את המונח "ניתוח עסקי" בהקשרים כגון תוכניות תואר שני. בחלק השאלות והתשובות של הנאום המרכזי שלו במפגשים הסטטיסטיים המשותפים של האגודה האמריקנית לסטטיסטיקה, אמר הסטטיסטיקאי נייט סילבר: ”אני חושב שמדען-נתונים הוא רק מונח מסוגנן לסטטיסטיקאי”[9]. כמו כן, במגזר העסקי, חוקרים ואנליסטים רבים קובעים כי מדעני נתונים לבדם רחוקים מלספק יתרון תחרותי אמיתי, וגורסים כי יש לשקול לסווג את מדעני הנתונים תחת אחת מארבע המשרות (אנליסטים עסקיים, מדעני נתונים, מפתחי Big data גדולים, ומהנדסי Big data) הדרושות למנף ביעילות ארגון או חברה עסקית כלשהי לעבר שימוש ב-"Big data".
Remove ads
ראו גם
- מדעי המידע וטכנולוגיות אינטרנט
- טכנולוגיות מידע ותקשורת
- הנדסת ידע (אנ') - Knowledge engineering
- מערכות מבוססות-ידע (אנ') - Knowledge-based systems
- כריית מידע
- ניתוח מידע
- ביג דאטה
- בינה מלאכותית
- בינה עסקית
- מידענות סייבר
- מקצועות אבטחת מידע
קישורים חיצוניים
- "מדעני נתונים: העבודה הכי סקסית של המאה ה-21", אוקטובר 2012, ב"הרווארד ביזנס רוויו"
- "מה אני צריך מסטטיסטיקאי" (אורכב 23.08.2013 בארכיון Wayback Machine), אוגוסט 2013, באתר: "statisticsviews"
- אושרית גן-אל, האוניברסיטאות כבר ערוכות: זהו המקצוע החדש והמבוקש במשק, באתר גלובס, 24 בפברואר 2019
- אמיר עוז, דטה היא כוח: עליית ה-CDO כאיש מפתח בהצלחת הארגון, באתר "אנשים ומחשבים", 4 במרץ 2020
Remove ads
הערות שוליים
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads