ליצירת קשר
whatsapp
לימודי הייטק ב-INT LIVE
טלפון

Machine Learning מה זה?

INT College

אנחנו נמצאים בעידן ה-AI, הבינה המלאכותית, ונדמה שכמעט כל יום יוצא איזה כלי AI חדש ומעניין, שאנחנו פשוט חייבים לבדוק. אולם בשיח המסלים במהירות סביב הנושא של AI, לא רבים מודעים לכך שלא פעם הם עושים שימוש לא מדויק במונח בינה מלאכותית, כאשר הם משתמשים בו על מנת לתאר תחומים משיקים ומקבילים לבינה מלאכותית ללא משים, עם דגש מיוחד על Machine Learning. היות ובינה מלאכותית (וכן Machine Learning) היא By far הדבר הכי חם בשוק הטכנולוגיה, חשוב להמשיך לדייק את השיח שלנו בנושא, במיוחד כאשר אנחנו מתעניינים בלימודי מקצועות ההייטק; בהתאם לכך, הגיע הזמן שתדעו מה זה Machine Learning, ומה ההבדל בין תחום זה לבין בינה מלאכותית.

להבין מה זה Machine Learning

מרוב עצים לפעמים לא רואים את היער, ומרוב דיבורים על Mid Journey או ChatGPT כבר שכחנו מה זה בדיוק בינה מלאכותית. אז כדי לחדד, בינה מלאכותית היא למעשה ענף במדעי המחשב. מה שמאפיין את הענף של בינה מלאכותית, הוא שמדובר בפיתוח תוכנת מחשב כזאת או אחרת, שיודעת לבצע פעולות מורכבות, שפעם היו נחלתו הבלעדית של המין האנושי. הפעולות הללו יכולות להיות מתוארת באמצעות מושגים מופשטים כגון מיון-נתונים, ניתוח-נתונים וכדומה, או שאפשר לדבר על דברים מעשיים יותר כמו ציור או יצירת גרפיקה, נהיגה, אבחון מחלות וכדומה.

למידת מכונה, קרי Machine Learning, היא תת-תחום של בינה מלאכותית, והיא למעשה אחת הדרכים האפשריות לבצע את אותן פעולות באמצעות בינה מלאכותית. בעיקרון בינה מלאכותית היא משהו תבוני שמערכת עושה, והביטוי machine learning מתייחס לאופן שבו המערכת תעשה זאת. הייחוד של למידת מכונה הוא האופן שבו היא מבצעת: למידת מכונה משמע מודל שמלמד את עצמו באופן איטרטיבי באמצעות נתונים או דוגמאות, ובהדרגה משתפר ככל שהוא לומד יותר דוגמאות.

למה זה טוב? לעתים קשה בדיוק לכתוב תוכנה שתעשה בדיוק את מה שאנחנו רוצים, משום שמדובר במשימה מורכבת מדי או קשה מדי. למשל: אנחנו רוצים ליצור מכונית אוטונומית שתנהג ללא צורך בנהג. אי אפשר לכתוב תוכנה שתגיד למכונית פשוט "תנהגי"; צריך ללמד את המכונה באמצעות המון המון דוגמאות, כדי שהיא תבין מהי באמת צריכה לעשות. אחרי שהמכונה סופגת המון-המון דוגמאות להמון-המון מצבים, היא בשלה (האמנם?) לעלות על הכביש. זה בעצם Machine Learning: לתת למכונה ללמוד לבד משהו מורכב מאוד באמצעות דוגמאות.

באילו תחומים משתמשים בלמידת מכונה?

ביחד עם הגידול העצום בעולם הנתונים, עולם הביג דאטה, תחום הלמידת מכונה הפך לטכניקה המרכזית לעיבוד של נתונים ולהפקת תובנות במהירות מנתונים גולמיים. את למידת המכונה אנחנו יכולים למצוא במגוון תחומים וענפים:

  • עולם הרכב והתעופה
  • עיבוד תמונה -זיהוי פנים, זיהוי תנועה וכיוצ"ב
  • פיננסים – ניהול אשראי וניהול סיכונים
  • אנרגיה – חיזוי מחיר וצריכה בייצור אנרגיה
  • עיבוד שפה – הפיכת קול לטקסט

איך עובדת למידת מכונה

  • איסוף נתונים רלוונטיים כפי שהגדרתם – איכות וכמות הנתונים משפיעים מאוד על הצלחת המשימה
  • עיבוד נתונים ראשוני – הסרה של נתונים חריגים, טיפול בחסרים, כך שהכל יהיה בפורמט אחיד
  • הנדסת תכונה – יצירה של תכונות רלוונטיות שישמו את מודל למכינת המכונה
  • בחירת דגם – בחירת אלגוריתם / מודל בהתאם לבעיה אותה רוצים לפתור
  • אימון הדגם – אמון הדגם הוא הליבה של התהליך, במסגרתו מזינים לאלגוריתם נתונים ודוגמאות כדי ללמד אותו
  • פריסת המודל – לאחר הערכות ותיקונים ניתן להטמיע את המודל ולהשתמש בו לביצוע תחזיות בזמן אמת על נתונים חדשים

Machine learning – תת תחום של  Data Science

לאחר שהבנו מה זה Machine Learning, חשוב לדעת שמדובר בתת-תחום של ענף גדול מאוד. Data Science, ובעברית מדע נתונים, הוא הענף ממנו נגזרת למידת מכונה. זהו ענף בתחום המחקר והפיתוח שעוסק בהבנה וניתוח של נתונים, כדי לחשוף תובנות וטרנדים שיסייעו למקבלי ההחלטות להתחדש ולפתור בעיות. מדע נתונים כולל שימוש במגוון רחב של כלים וטכניקות לצורך שימוש במאגרי הנתונים, ואחד מהם הוא תחום Machine Learning, בו אנו עוסקים במאמר זה.

סוגי Machine Learning

ב-Machine Learning, הלמידה של המכונה נעשית באחת משלושה אופנים:

  1. למידה מונחית.
  2. למידה לא-מונחית.
  3. למידה באמצעות חיזוקים.

ההבדל בין שלושת האופנים השונים, הוא סוג המידע שמשמש בהזנת המערכת. בלמידה מונחית, הנתונים עליה מתאמנת המערכת בשלב הלמידה שלה הם מה שנקרא "מידע מסומן" (Labeled Data), כלומר מידע שעבר סימון על ידי אנשי Annotation. במצב זה המערכת מקבלת את הקלט והפלט הרצוי, והמספר הרב של הדוגמאות מלמד אותה להסיק את הקשר בין הקלט והפלט. לעומת זאת, למידה לא-מונחית, היא מצב שבו המידע המשמש את המערכת אינו מסומן. במצב זה, אחרי שהמערכת נחשפת להמון דוגמאות מידע, היא יודעת להסיק מה "הנורמה" ומה חורג מהנורמה.

למידה באמצעות חיזוקים, היא למידה הדומה לדרך שבה בני אדם או אפילו בעלי חיים לומדים, והיא באמצעות חיזוק או עונש ביחס לכל ניסיון זיהוי או חיזוי. התהליך מזכיר את מה שקורה במוח שלנו בהקשר של חיזוקים: המערכת נחשפת למשהו, למשל תמונה של כלב, והמידע הזה עובר במערכת כמו אנרגיה פוטונית; אחרי שהמערכת נחשפת להמון תמונות של כלבים, היא יכולה להתחיל להתאמן ולנסות לזהות מתי עומד מולה כלב. העיקרון בלמידת מכונה הוא שברגע שהמערכת טועה, היא נענשת באמצעות פונקציית הפסד המוגדרת באלגוריתם של למידת המכונה, כך שהאלמנט שהביא אותה לזיהוי מוטעה לא יחזור שוב בפעם הבא.

כך קורה שהמערכת משתפרת מהטעות הזאת לפעם הבאה. אחרי המון חזרות, בסוף המטרה היא שהמערכת תדע לזהות מתי מדובר בכלב, ממש כפי שבני אדם ידעו לזהות מתי עומד מולם כלב ומתי חתול, שועל או זאב.

 מי שלא טועה – לא לומד. בשורה התחתונה, ככל שתזינו למערכת יותר נתונים ויותר שאלות, כך התחזיות שלה יהיו יותר מדויקת.

רוצים לתכנת את המכונית האוטונומית הבאה?

מהיום, כשישאלו אתכם מה זה Machine Learning, תדעו לענות כמו גדולים. ומה עם ללמוד את זה? תחום הדאטה סיינס, ובתוכו למידת מכונה, הוא אחד התחומים הכי נחשקים ויוקרתיים כיום, עם אפשרות לעסוק בפרויקטים של פעם בחיים, והשכר בהתאם. הפוטנציאל בתחום הוא אדיר: פיתוח של רובוטים, תכנות של רכבים אוטונומיים, פתרונות פורצי דרך בתחום הרפואה ועוד.

רוצים לשמוע על קורס דאטה סיינס ובינה מלאכותית במכללת INT? לחצו כאן

לקביעת שיחת ייעוץ חינם

    שיחה עם נציג

    דילוג לתוכן