DATA SCIENCE

Things get done only if the data we gather can inform and inspire those in a position to make a difference (Dr. Mike Schmoker)

האומנות והמדע של חילוץ ידע ופתרונות מבוססי נתונים

תוצאה הופכת למידע. המידע מתורגם ללמידה. הלמידה מובילה למעשה. המעשה מחולל את התוצאה הבאה. 

עם מדע הנתונים אנחנו עושים זאת באופן מובנה ושיטתי תוך שילוב יצירתיות, למידה סטטיסטית ותכנה בכדי לשפר את תהליך הלמידה, הפקת התובנות וההחלטות בארגון. 

צחי פרנקוביץ

איך ולמה ?
התהליך
  1. הגדרת המטרה / הדילמה שנדרש לה פתרון מבוסס נתונים.
  2. זיהוי הנתונים הפנים ארגוניים ומקורות חיצוניים העשויים לשמש בהשגת המטרה.
  3. ניתוח ולמידה של הנתונים להכרת העולם הארגוני דרך העובדות. 
  4. זיהוי והחלטה על שיטת הלמידה הסטטיסטית המתאימה לסוגיה שעל הפרק. 
  5. הכנת הנתונים, לרבות טיפול במידע שגוי, תיקון נתונים והעשרת המידע באמצעות יצירת מאפיינים חדשים המתארים את התופעה שעל סדר היום.
  6. פיתוח ומחקר מודלים של למידה סטטיסטית (למידת מכונה / AI) במטרה לזהות את הפתרון הטוב ביותר לבעיה.
  7. מימוש ויישום בתהליכים הארגוניים הרלוונטיים.

מערכות המלצה

הרעיון המרכזי במערכת המלצה הוא לתת לארגון או ללקוח סיוע בקבלת החלטות. דוגמא לפרויקט – מערכת המלצה לקמפיינים שיווקיים. הצורך – הארגון מבקש למנף את מאגרי המידע שלו כדי לזהות ולמקד מאמצים שיווקיים מותאמים ללקוחות. הפתרון – פיתוח מחולל רשימות שיווק לקמפיינים ממוקדים שיודע לחלץ מתוך מאגרי החברה את המועמדים הטובים ביותר לשיווק יזום בהינתן סוג הקמפיין שהוגדר. מימוש – האלגוריתם מופעל רוטינית או על פי בקשה ומייצר רשימה שמוזרמת ל CRM כהזדמנויות חדשות לאנשי המכירות. מנועי המלצה יכולים לשמש במגוון גדול של יישומים. למשל – המלצה של פריטים לרכישה באתר על פי מאפייני הלקוח וסלי הקניות שלו. המלצה לקבלת החלטות במסחר והשקעות בני"ע. ועוד.

חיזוי

חיזוי הוא הגביע הקדוש של יישומי מדע הנתונים, והוא גם המאתגר ביותר. מי לא היה רוצה לדעת מה יקרה בעתיד ולהחליט היום כדי להתארגן לכך? מדע הנתונים לא יגלה לנו מה יקרה בעתיד אבל עשוי לסייע לנו להבין יותר טוב מה יכול לקרות בעתיד בהינתן כל מה שאנו יודעים כיום. ובעולם של קבלת החלטות זה בדרך כלל עדיף על ניחוש או ניסיון להחליט רק על סמך תחושות בטן, ניסיון או רצונות. דוגמא לפרויקט – מערכת חיזוי מכירות. הצורך – חיזוי המכירות משמש לתכנון ייצור, רכש וניהול מלאים. חיזוי טוב יקטין סיכון לעודפי מלאי או לחוסר במלאים לנוכח הביקוש הצפוי למוצרי החברה. הפתרון – פיתוח מודל חיזוי למכירות ברמת לקוח ופריט. מימוש – האלגוריתם מופעל רוטינית אחת לחודש ומעדכן את הפורטל ומערכת התכנון בארגון.

תובנה עסקית

עולם הנתונים הארגוני משמש באופן שגרתי להבנת הארגון. מה היו המכירות שלנו ברבעון האחרון לפי לקוחות או מוצרים? התוצאות של מרכזי הרווח? ההוצאות לפי ספקים? וכדומה. זוהי תובנה עסקית מעולם ה BI והיא נפוצה מאוד בעולם העסקי. אבל מה אם השאלות שלנו קצת יותר מורכבות? שאלות שלא ניתן להשיב עליהן באופן ישיר באמצעות מערכת ה BI? דוגמא לפרויקט – כיצד עלינו לנהל הקצאה של מטלות בהינתן רמת העומסים האופייניים ותכונות התהליכים המנוהלים? הצורך – הארגון רוצה להבין היכן נמצאים צווארי בקבוק והיכן יש "אבטלה סמויה" כדי לנתב טוב יותר מאמצים בתחום הטיפול בלקוח. הפתרון – פיתוח מודל שמעריך מאמץ שנתי נדרש בהינתן תיק לקוחות נתון וזיהוי פערי תשומות בין מאמץ צפוי לבין היקף התשומה בפועל. מימוש – האלגוריתם מופעל רוטינית ומחולל דו"ח מאמצים מול תפוקות ברמת מנהלים.