הנושא החם בהייטק הוא בינה מלאכותית, וכמעט כל פרויקט כיום משלב בתוכו אלמנט כזה או אחר של AI. כאשר אנו מדברים על בינה מלאכותית, אנחנו לא תמיד מודעים לכך שישנן מספר טכניקות שונות בהן "הבינה" לומדת באופן עצמאי ומשתפרת. אחת הטכניקות החשובות, אם לא החשובה ביניהן, היא הטכניקה המכונה "למידה מפוקחת". אז מה זה למידה מפוקחת ולמה אתם חייבים להכיר אותה? על כך במאמר זה.
כיצד לומדת הבינה
כאשר אנו מדברים על בינה מלאכותית, אנחנו מדברים על היכולת של מחשב לבצע פעולה "אנושית"; ישנן אינספור דוגמאות, אז לשם הנוחות ולצורך הסבר פשוט, נבחר ביכולת אחת כדוגמה: יכולת למיין ולסווג פירות. כלומר, אם אנו מראים למחשב תמונה של פרי, והוא יודע לזהות באיזה פרי מדובר, אזי יש כאן פונקציה המערבת בינה מלאכותית.
עכשיו, איך המחשב לומד לעשות פעולה כזאת? דרך אחת נקראת למידת מכונה (Machine Learning). למידת מכונה היא תת-תחום בבינה מלאכותית (אולי תת-התחום המרכזי כיום), ובו המכונה מלמדת את עצמה כיצד לבצע את אותה פעולה אנושית (במקרה שלנו, סיווג ירקות). כיצד המכונה לומדת? שלוש טכניקות: למידה מונחית, למידה לא-מונחית, ולמידה באמצעות חיזוקים. ההבדל בין הטכניקות הוא בדרך שבו מזינים את המערכת במידע.
- בלמידה מונחית (Supervised Learning), מסמנים למערכת מידע המוזן לתוכה. לאחר המון דוגמאות, היא לומדת את התוצאה הרצויה.
- בלמידה לא מונחית, מזינים מידע לא מסומן, כך שכביכול אין תוצאה רצויה (וכך המערכת לומדת לזהות אנומליות).
- בלמידה באמצעות חיזוקים, פשוט נותנים חיזוק חיובי או שלילי על כל זיהוי נכון (למשל של מיון פירות כאמור), ולאחר המון דוגמאות, המערכת לומדת מהו פרי ומה לאו.
כיצד עובדת למידה מונחית
למידה מונחית כאמור משמע לימוד המערכת באמצעות מידע מסומן. ישנן שתי דרכי התמודדות עיקריות עבור המכונה בתהליך למידה מונחית: סיווג (classification) ורגרסיה (regression).
- טכניקת סיווג משמע להשתמש באלגוריתם לצורך סיווג המידע לפי מאפיינים שונים לכדי קבוצות. למשל: יש ירקות שיש להם צורה אנכית; ויש ירקות ירוקים. אם הם גם בעלי צורה אנכית וגם ירוקים, יתכן שמדובר במלפפון או קישוא.
- טכניקת רגרסיה משמע להבין את ההקשר בין המשתנים הבלתי תלויים בפריטים, באמצעות ניתוח סטטיסטי של המון נתונים.
אותן טכניקות סיווג, הן "שם-גג" לאלגוריתמים רבים בתחום של למידה מונחית, שהם מעיין טכניקות שונות לביצוע למידה מונחית.
אלגוריתמים של למידה מונחית
יש המון אלגוריתמים המשמשים לצורך למידה מונחית. ניגע בכמה מן האלגוריתמים הללו בקצרה, כדי להבין את העיקרון, וכיצד הם מתקשרים לאופן שבו עובדת למידה מונחית.
רשתות נוירונים
רשתות נוירונים (Neural networks) הינו אלגוריתם מתמטי העובד בצורה דומה לנוירונים במוח: כל נוירון (או node במקרה שלנו) עושה פעולה אחת פשוטה, והקשרים המורכבים בין הנוירונים מאפשרים לבצע פעולות מורכבות. למשל, במקרה של סיווג ירקות, node אחד מזהה את הצבע של הירק, node אחר את המרקם, node נוסף את הצורה וכן הלאה, וביחד המערכת מזהה באיזה פרי מדובר.
רגרסיה לינארית
רגרסיה לינארית משמשת לזהות הקשרים בין משתנה תלוי לבין משתנה בלתי תלוי אחד או יותר, לצורך ביצוע תחזית לגבי התוצאה. למשל, ככל ש-X גדול יותר, כך גדל ה-Y (או לחילופין, כך קטן ה-Y). למשל, בדוגמה שלנו, ככל שהצורה דומה במתאר שלה לתפוח, כך סביר שמדובר בתפוח.
אלגוריתם שכן קרוב (K-nearest neighbor)
משמש לסווג מידע על בסיס קרבה ודמיון למידע הקיים. האלגוריתם מניח שדמיון בנקודות דאטה מסוימות משמע קרבה. למשל, מקבלים תמונה של פרי, ועל בסיס נקודות דאטה שונות (צבע, צורה, מרקם וכדומה), ניתן לסווג אותו לפרי עמו הוא חולק מאפיינים משותפים, וכך ניתן להסיק בדבר זיהויו של הפרי הראשון.