אוטומציה: העתיד של מדעי הנתונים ולמידת מכונות?

למידת מכונה הייתה אחת ההתקדמות הגדולות בהיסטוריה של המחשוב ועכשיו היא נתפסת כמסוגלת למלא תפקיד חשוב בתחום הביג דאטה וניתוח. ניתוח נתונים גדולים הוא אתגר עצום מבחינה ארגונית. לדוגמה, פעילויות כגון הבנת המספר הרב של פורמטים שונים של נתונים, ניתוח הכנת נתונים וסינון נתונים מיותרים יכולים להיות עתירי משאבים. גיוס מומחי מדען נתונים הוא הצעה יקרה ולא אמצעי למטרה של כל חברה. מומחים סבורים שלמידת מכונה יכולה להפוך את רוב המשימות הקשורות לניתוח - אוטומטיות ומורכבות - לאוטומטיות. למידת מכונה אוטומטית יכולה לפנות משאבים משמעותיים שיכולים לשמש לעבודה מורכבת וחדשנית יותר. נראה שלמידת מכונה נעה בכיוון זה כל הזמן.

אוטומציה בהקשר של טכנולוגיית המידע

ב- IT, אוטומציה היא חיבור של מערכות ותוכנות שונות, המאפשרות להן לבצע משימות ספציפיות ללא כל התערבות אנושית. ב- IT מערכות אוטומטיות יכולות לבצע עבודות פשוטות ומורכבות כאחד. דוגמה לעבודה פשוטה עשויה להיות שילוב טפסים עם מסמכי PDF ושליחת מסמכים לנמען הנכון, בעוד שגיבוי מחוץ לאתר עשוי להיות דוגמא לעבודה מורכבת.

כדי לבצע את עבודתך כראוי, עליך לתכנת או לתת הוראות ברורות למערכת האוטומטית. בכל פעם שיש צורך במערכת אוטומטית לשינוי היקף תפקידה, מישהו צריך לעדכן את התוכנית או ערכת ההוראות. למרות שהמערכת האוטומטית יעילה בתפקידה, טעויות עלולות להתרחש מסיבות שונות. כאשר מתרחשות טעויות, יש לזהות ולתקן את שורש השורש. ברור שכדי לעשות את עבודתה, מערכת אוטומטית תלויה לחלוטין בבני אדם. ככל שאופי העבודה מורכב יותר, כך הסיכוי לטעויות ובעיות גבוה יותר.

דוגמה נפוצה לאוטומציה בתעשיית ה- IT היא אוטומציה של בדיקות ממשקי משתמש מבוססי אינטרנט. מקרי בדיקה מוזנים לתסריט האוטומציה וממשק המשתמש נבדק בהתאם. (למידע נוסף על היישום המעשי של למידת מכונה, ראה למידת מכונות והדופ בזיהוי הונאה מהדור הבא.)

הטענה לטובת אוטומציה היא שהיא מבצעת משימות שגרתיות וחוזרות על עצמן ומשחררת עובדים לביצוע משימות מורכבות ויצירתיות יותר. עם זאת, נטען גם כי האוטומציה לא כללה מספר רב של משימות או תפקידים שבוצעו בעבר על ידי בני אדם. כעת, כאשר למידת מכונה נכנסת לתעשיות שונות, האוטומציה יכולה להוסיף ממד חדש.

העתיד של למידת מכונה אוטומטית?

המהות של למידת מכונה היא היכולת של מערכת ללמוד באופן רציף מנתונים ולהתפתח ללא התערבות אנושית. למידת מכונה מסוגלת להתנהג כמו מוח אנושי. לדוגמה, מנועי המלצות באתרי מסחר אלקטרוני יכולים להעריך את העדפותיו וטעמו הייחודי של המשתמש ולספק המלצות על המוצרים והשירותים המתאימים ביותר לבחירה. בהתחשב ביכולת זו, למידת מכונה נתפסת כאידיאלית לאוטומציה של משימות מורכבות הקשורות בנתונים גדולים וניתוחים. היא התגברה על המגבלות העיקריות של מערכות אוטומטיות מסורתיות שאינן מאפשרות התערבות אנושית באופן קבוע. ישנם מספר מחקרי מקרה המדגימים את היכולת של למידת מכונה לבצע משימות ניתוח נתונים מורכבות, אשר יידונו בהמשך מאמר זה.

כפי שכבר צוין, ניתוח נתונים גדולים הוא הצעה מאתגרת לעסקים, שניתן להאציל חלקית למערכות למידת מכונה. מנקודת מבט עסקית, זה יכול להביא יתרונות רבים כגון שחרור משאבי מדעי הנתונים למשימות יצירתיות יותר ולמשימה קריטית, עומסי עבודה גבוהים יותר, פחות זמן להשלמת משימות ויעילות.

מקרה בוחן

בשנת 2015, חוקרי MIT החלו לעבוד על כלי מדעי נתונים שיכול ליצור מודלים של נתונים מנבאים מכמויות גדולות של נתונים גולמיים באמצעות טכניקה הנקראת אלגוריתמים לסינתזה של תכונה עמוקה. המדענים טוענים שהאלגוריתם יכול לשלב את התכונות הטובות ביותר של למידת מכונה. לדברי המדענים, הם בדקו את זה על שלושה מערכי נתונים שונים והם מרחיבים את הבדיקות כך שיכללו עוד. במאמר שיוצג בכנס הבינלאומי למדעי נתונים וניתוחים אמרו החוקרים ג'יימס מקס קנטר וקאליאן וירמאצ'אנני, "באמצעות תהליך כוונון אוטומטי אנו מייעלים את כל הדרך ללא מעורבות אנושית ומאפשרים לה להכליל למערכי נתונים שונים".

בואו נסתכל על מורכבות המשימה: לאלגוריתם יש את מה שמכונה יכולת התאמה אוטומטית, בעזרתם ניתן להשיג או להפיק תובנות או ערכים מנתונים גולמיים (כגון גיל או מין), ולאחר מכן נתוני ניבוי. ניתן ליצור מודלים. האלגוריתם משתמש בפונקציות מתמטיות מורכבות ובתורת הסתברות הנקראת גאולה קופולה. לכן קל להבין את רמת המורכבות שבה האלגוריתם יכול להתמודד. טכניקה זו זכתה גם בפרסים בתחרויות.

למידת מכונה יכולה להחליף שיעורי בית

דנים בעולם כי למידת מכונה יכולה להחליף עבודות רבות מכיוון שהיא מבצעת משימות ביעילות המוח האנושי. למעשה, קיים חשש כי למידת מכונה תחליף את מדעני הנתונים, ונראה שיש בסיס לדאגה כזו.

עבור המשתמש הממוצע שאין לו כישורי ניתוח נתונים אך בעל דרכים שונות של צרכים אנליטיים בחיי היומיום שלו, לא ניתן להשתמש במחשבים שיכולים לנתח כמויות עצומות של נתונים ולספק נתוני ניתוח. עם זאת, טכניקות עיבוד שפה טבעית (NLP) יכולות להתגבר על מגבלה זו על ידי לימוד מחשבים לקבל ולעבד שפה אנושית טבעית. בדרך זו, המשתמש הממוצע אינו זקוק לפונקציות או מיומנויות אנליטיות מתוחכמות.

IBM מאמינה שניתן לצמצם או לבטל את הצורך במדעני נתונים באמצעות המוצר שלה, פלטפורמת Watson Natural Language Analytics. לדברי מארק אטשולר, סגן נשיא לאנליטיקה ומודיעין עסקי בווטסון, "עם מערכת קוגניטיבית כמו ווטסון, אתה פשוט שואל את השאלה שלך - או אם אין לך שאלה, אתה פשוט מעלה את הנתונים שלך ווטסון יכול להסתכל על זה ולהסיק מה אולי תרצה לדעת. ”

סיכום

אוטומציה היא השלב ההגיוני הבא בלמידת מכונות ואנו כבר חווים את ההשפעות בחיי היומיום שלנו-אתרי מסחר אלקטרוני, הצעות לחברים בפייסבוק, הצעות לרשת לינקדאין ודירוג חיפושים ב- Airbnb. בהתחשב בדוגמאות שניתנו, אין ספק שניתן לייחס זאת לאיכות הפלט המיוצר על ידי מערכות למידת מכונה אוטומטיות. למרות כל התכונות והיתרונות שלו, הרעיון של למידת מכונה הגורמת לאבטלה עצומה נראה קצת תגובת יתר. מכונות החליפו את בני האדם בחלקים רבים של חיינו במשך עשרות שנים, אך בני האדם התפתחו והתאימו את עצמם כדי להישאר רלוונטיים בתעשייה. על פי התפיסה, למידת מכונה על כל השיבושים שלה היא רק עוד גל שאנשים יסתגלו אליו.


זמן פרסום: 03-08-2021