קורס דאטה סיינס / Data Science
בחסות האוניברסיטה הפתוחה
מערך לימודי החוץ
בעידן המודרני תחום מדעי הנתונים הוא אחד מהתחומים הצומחים ביותר בשנים האחרונות. התחום משפיע על אספקטים רבים ושונים כך שיש המכנים אותו – "המהפכה התעשייתית הרביעית". בנוסף לפופולריות הגדלה שלו, התחום מאפשר לאנשים בעלי רקעים שונים להשתמש בידע שצברו בתחום ההתמחות שלהם עבור פיתוח אלגוריתמים רלוונטיים למקצוע.
מהו קורס דאטה סיינס ומה לומדים בו?
תהליך ההכשרה לתפקיד מדען נתונים הינו הליך משמעותי, אשר במהלכו תלמדו את כל הכלים הדרושים להתנעת הקריירה שלכם.
במהלך תוכנית הכשרה מקיפה זו, תרכשו כלים מתמטיים, כלים תכנותיים והבנה עמוקה בסוגיות ריאליסטיות של למידת מכונה. זאת על מנת להכשיר אתכם באופן מלא לתחילת הקריירה שלכם בתחום.
תיאור הקורס
קורס דאטה סיינס משלב מתודולוגית למידה במודל המבוסס על למידה אקטיבית של הסטודנט, המשלבת בין יישום פרקטי (Hands-On) ורכישת ידע. מודל זה מקנה יכולות חשיבה ביקורתיות לצורך יישום מעשי של משימות מאתגרות, ומערבות את הסטודנט בפתרון בעיות וקבלת החלטות. בין היתר, הנושאים העיקריים הנלמדים בקורס יהיו:
- Mathematics
- Basic Machine Learning
- Python for Data Scientists
- Basic Neural Network and Deep Neural Network
- Advanced ML & Deep Neural Network
היקף השעות
392 שעות לימוד אקדמיות הכוללות עבודה עצמית על פרויקטים ועבודה על פרויקט הגמר.
קהל היעד ותנאי קבלה
- הקורס מתאים לאנשי QA / Data Analyst , וכמו כן לאנשים בעלי רקע בעולם ההייטק
- אנשים עם אוריינטציה מוכחת בעבודה עם נתונים (במסגרת לימודים או עבודה)
- בעלי תואר ראשון במדעים מדויקים (הנדסה, פיזיקה, כימיה) / מתמטיקה / חשבונאות/ כלכלה ומנהל עסקים או בעלי תואר ראשון בפסיכולוגיה / מדעי החברה בעלי ניסון בעבודה עם נתונים או בעלי תואר שני מחקרי
- נדרשת אנגלית ברמה גבוהה
יתרונות הקורס
- מתודולוגית הלמידה ב-INT הינה במודל המבוסס על למידה אקטיבית של הסטודנט, המשלבת בין יישום פרקטי (Hands-On) ורכישת ידע
- הלמידה תהיה מבוססת פרויקטים ופרויקט גמר המדמה את הנדרש מהסטודנטים בתעשיית ההייטק. העבודה על הפרויקטים היא משותפת ומתבצעת בקבוצות קטנות, ומלווה על ידי המרצה.
- INT מספקת לסטודנטים את המעטפת המתאימה לחוויית לימודים מיטבית ופרקטית.
- רכישת הידע נעשית ע"י הרצאות תאורטיות, בשילוב פעילויות אינטראקטיביות המסייעות בהבנה ובהטמעת החומר הנלמד, תרגול וסימולציות ובאמצעות למידה עצמאית
- קורס זה מוכר בפיקדון לחיילים משוחררים
איפה משתלבים בשוק העבודה אחרי הקורס?
לרוב החברות היום יש אחוז ניכר של מומחי דאטה סיינס מתוך הצוות הטכנולוגי לרבות חברות הייטק, חברות טכנולוגיות רפואיות, חברות ביטוח, פיננסים, ארגונים ממשלתיים, בתי חולים, חברות ייעוץ חברות העוסקות בביג דאטה ועוד.
תעודות והסמכות
דרישות לזכאות תעודת גמר:
- השתתפות בלפחות 85% משעות הקורס
- נוכחות חובה בהגשת פרויקט הגמר
- חובת הגשת כל מטלות הקורס וקבלת ציון עובר (מבחנים, תרגילים, עבודות, פרויקטים)
קורס דאטה סיינס על חשבון הפיקדון לחיילים משוחררים
אם אתם חיילים משוחררים ומחפשים אחר קורס דאטה סיינס שמוכר בפיקדון, הגעתם למקום הנכון, קורס הדאטה סיינס שלנו מוכר על ידי משרד העבודה (מספר אישור 02445720) ומקנה כלים מתמטיים, כלים תכנותיים והבנה עמוקה בסוגיות ריאליסטיות של למידת מכונה.
שאלות נפוצות על קורס דאטה סיינס
תחום ה-Data Science הוא אחד מהתחומים הצומחים באופן היציב ביותר בתעשיית ההייטק ובעוד שתחומים מסוימים צמחו במהירות אבל נשארו קבועים לאורך זמן, באופן מפתיע התחום צומח באופן קבוע כבר מעל לעשר שנים.
רמת העניין בתחום גבוהה באופן יחסי למשרות אחרות בהייטק, בנוסף לכך, כיום ישנם מעט אוניברסיטאות שמלמדות את המסלול באופן ישיר ולרוב ההכשרה האוניברסיטאית היא יותר תיאורטית מאשר מעשית ולכן נדרשת עוד הכשרה בנוסף לאקדמיה.
אנחנו ב-INT פיתחנו תוכנית מלאה שכוללת את הרכיבים החשובים ביותר כדי להצליח היום בתעשייה. בנוסף הגישה הלימודית מכוונת פרויקטים, עבודה מעשית ומיומנויות מחקר ולימוד עצמי כך שהבוגרים שלנו מקבלים את האינקובציה הטובה ביותר שיכולנו ליצור עבור ההתפתחות המקצועית שלהם.
משכורת Data Science מתחיל בדרך כלל נעה בין 18 – 23 אלף. לרוב קשה להגיע למשרת Data Science מתחיל ולכן הרבה אנשים שהם חסרי רקע אקדמי מתאים יאלצו להתפשר במשכורת עבור השנה – שנתיים הראשונות.
לעומת זאת, בעלי רקע בהנדסה, מדעי המחשב ו/או ניסיון קודם בתעשייה יכולים להתחיל במשכורות הללו.
כן, נדרש תואר ראשון במדעים מדויקים ואנגלית ברמה גבוהה.
התפקיד המרכזי של מדען הנתונים הוא להיות אחראי על ניתוח והסקת מסקנות מהנתונים בחברה, בדרך כלל יש שלושה סוגים של מדעני נתונים בחברות השונות כאשר לרוב ההבחנה היא תחת מי יושב צוות מדעני הנתונים
– מדען נתונים בחברה שליבת המוצר שלה כוללת למידת מכונה: במקרה זה הצוות יהיה לרוב תחת צוות המחקר ( לדוגמה: מיקרוסופט, פייסבוק, פאלו אלטו נטוורקס וכדומה)
– מדען נתונים בחברה שבה למידת מכונה היא חלק מהיכולות של המוצר בנוסף ליכולות אחרות: במקרה זה יהיו מספר מדעני נתונים בצוותים השונים (לדוגמה: וויקס, בוקינג.קום, אירון סורס)
– מדען נתונים בחברה שאין למידת מכונה במוצר עצמו, במקרה זה תפקיד מדען הנתונים יהיה לרוב אחראי על סיפוק יכולות עסקיות – שיווקיות ( לדוגמה: חברות ביטוח, הוט, יס וכדומה )
לכל אחת מהשלושה יש כמובן מאפיינים שונים, אבל בגדול העבודה היום יומית תהיה
– עבודה מחקרית על ליבת המוצר לשפר את התוצאות ולהוסיף פיטשרים
– עבודה במחלקה הספציפית כדי לתת מענה לדרישות מוצריות שונות לדוגמה: לשפר את אחוזי הסגירה באתרי תיירות
– לשפר יעדים עסקיים שונים: שיווק יעיל יותר, ניתוח עזיבת לקוחות וכדומה
באופן כללי ההנחה הרווחת היא שאנליסט לא מקודד אלא משתמש בפתרונות לניתוח מידע כמו Tablue, Power BI.
במקום ליצור תהליך אוטומטי לניתוח המידע הוא מנתח אותו באופן ידני, בימינו הגבול בניהם מטשטש, מאוד נפוץ לראות אנליסטים שמתכנתים בעצמם ויוצרים אוטומציה של האנליזה.
הבדל שעדיין נשמר הוא השימוש במודלים פרדקטיביים: יכולות מחקריות: חשיבה עצמאית, להתעדכן במאמרים או כתבות, הבנה של האספקטים התיאורטיים יכולות ניתוח מידע כמו; ניתוח כמותי, סטטיסטי – הסתברותי של מידע בעזרת קוד, בדיקת מודלים, יצירת פיטשרים. ויכולות אופרטיביות: יכולות תכנות גבוהות, עבודה עם תשתיות מידע ( DevOps )
מבחינת חלוקת הזמן הנדרש זה בערך 40% עבור אופרציה, 40% עבור ניתוח המידע ו- 20% יכולות מחקריות
לכן, צוות בדרך כלל יכלול לפחות מדען נתונים אחד עם רקע בתכנות, מדען נתונים עם רקע בניתוח מידע או ג'וניור, ומדען נתונים מנוסה שיכיר את הספרות הרלוונטית
תוכנית לימודים
שלב ראשון
• Probability
• Statistics
• Linear algebra
• Calculus
המתמטיקה מהווה את הבסיס ליכולות של מדען הנתונים, היא הלוגיקה והגיון מאחורי המודלים האלגורתמיים. בחלק זה נלמד באופן פרקטי את הנושאים המרכזיים הדרושים להבנת האלגוריתמים והשימושים בהם שאותם נלמד בחלקים המתקדמים יותר
שלב שני
• Linear models
• Decision tree
• k-nearest neighbours classifier
• Random forest
• XGboost
בחלק זה נכיר את המודלים הבסיסיים של למידת מכונה – כיצד לכתוב קוד לצורך בנית המודלים ואת הרקע התיאורטי שעומד מאחוריהם, בנוסף נכיר שיטות בסיסיות להערכת מודלים ושימוש בטכניקות בסיסיות של חלוקת המידע כדי ליצור מודלים עמידים יותר
שלב שלישי
במסגרת הפרק, נכיר ספריות כגון Pandas וספריות דומות כדי לעבד את המידע לצורך ניקוי והכנת המידע ללמידת מכונה.
בנוסף, נשתמש בכלים שלמדנו לפני כדי לבדוק ולשפר את המודלים שלנו באמצעות כלים כגון Feature Engeneering, Data Cleaning
שלב רביעי
• recurrent neural network
• convolutional neural network
• Voice recognition
• Cross-validation
• NLP
• TensorFlow
• PyTorch
בחלק זה נלמד על אבני הבסיס של המודלים המתקדמים ללמידת מכונה עמוקה שעל בסיסה מתבססים המודלים המורכבים יותר
שלב חמישי
• Evaluation
• Future Engineering
• Data cleaning
• advance overfitting
במסגרת הפרק, נלמד על ארכיטקטורות של מודלים עמוקים שמשמשות לשימושים שונים כגון NLP, Image Processing, Time Series Analysis. ואספקטים מתקדמים ופרקטיים יותר בלמידת מכונה שמטרתם שיפור המודלים והתוצאות בשטח.
שלב שביעי
- Final Project
- Industry Project
חלק זה הינו גולת הכותרת של ההכשרה!
נלמד כיצד להתמודד עם אתגרים מציאותיים מהעולם וכיצד לחבר נכון את הכלים שרכשנו כדי ליצור פתרונות פרקטיים.
שלב שישי
• model Interoperability
• Transfer learning
• generative adversarial networks (GANs)
• Deep reinforcement learning
לאחר סיום הפרויקט וההתמודדות עם האתגרים שנתקל בהם בעולם האמתי, נעמיק לשיטות מודרניות לפתרון האתגרים הללו באמצעות מודלים מתקדמים המשמשים את אנשי המקצוע השונים בתעשיית ההיי-טק.
שלב שביעי
החלק המסכם של ההכשרה הוא פרויקט שבו נתלווה לצוות קיים מהתעשייה, נלמד על האתגרים שלו ונייצר מענה לאתגרים ממשיים העולים מן השטח .