ליצירת קשר
whatsapp
לימודי הייטק ב-INT LIVE
טלפון
פול סטאק

קורס דאטה סיינס / Data Science

בחסות האוניברסיטה הפתוחה
מערך לימודי החוץ

 תאריך הקורס: 30/06/24  392 שעות אקדמיות

בעידן המודרני תחום מדעי הנתונים הוא אחד מהתחומים הצומחים ביותר בשנים האחרונות. התחום משפיע על אספקטים רבים ושונים כך שיש המכנים אותו – "המהפכה התעשייתית הרביעית". בנוסף לפופולריות הגדלה שלו, התחום מאפשר לאנשים בעלי רקעים שונים להשתמש בידע שצברו בתחום ההתמחות שלהם עבור פיתוח אלגוריתמים רלוונטיים למקצוע.

מהו קורס דאטה סיינס ומה לומדים בו?

תהליך ההכשרה לתפקיד מדען נתונים הינו הליך משמעותי, אשר במהלכו תלמדו את כל הכלים הדרושים להתנעת הקריירה שלכם.
במהלך תוכנית הכשרה מקיפה זו, תרכשו כלים מתמטיים, כלים תכנותיים והבנה עמוקה בסוגיות ריאליסטיות של למידת מכונה. זאת על מנת להכשיר אתכם באופן מלא לתחילת הקריירה שלכם בתחום.

תיאור הקורס

קורס דאטה סיינס משלב מתודולוגית למידה במודל המבוסס על למידה אקטיבית של הסטודנט, המשלבת בין יישום פרקטי (Hands-On) ורכישת ידע. מודל זה מקנה יכולות חשיבה ביקורתיות לצורך יישום מעשי של משימות מאתגרות, ומערבות את הסטודנט בפתרון בעיות וקבלת החלטות. בין היתר, הנושאים העיקריים הנלמדים בקורס יהיו:

  • Mathematics
  • Basic Machine Learning
  • Python for Data Scientists
  • Basic Neural Network and Deep Neural Network
  • Advanced ML & Deep Neural Network

היקף השעות

392 שעות לימוד אקדמיות הכוללות עבודה עצמית על פרויקטים ועבודה על פרויקט הגמר.

קהל היעד ותנאי קבלה

  • הקורס מתאים לאנשי QA / Data Analyst , וכמו כן לאנשים בעלי רקע בעולם ההייטק
  • אנשים עם אוריינטציה מוכחת בעבודה עם נתונים (במסגרת לימודים או עבודה)
  • בעלי תואר ראשון במדעים מדויקים (הנדסה, פיזיקה, כימיה) / מתמטיקה / חשבונאות/ כלכלה ומנהל עסקים או בעלי תואר ראשון בפסיכולוגיה / מדעי החברה בעלי ניסון בעבודה עם נתונים או בעלי תואר שני מחקרי
  • נדרשת אנגלית ברמה גבוהה

יתרונות הקורס

  • מתודולוגית הלמידה ב-INT הינה במודל המבוסס על למידה אקטיבית של הסטודנט, המשלבת בין יישום פרקטי (Hands-On) ורכישת ידע
  • הלמידה תהיה מבוססת פרויקטים ופרויקט גמר המדמה את הנדרש מהסטודנטים בתעשיית ההייטק. העבודה על הפרויקטים היא משותפת ומתבצעת בקבוצות קטנות, ומלווה על ידי המרצה.
  • INT מספקת לסטודנטים את המעטפת המתאימה לחוויית לימודים מיטבית ופרקטית.
  • רכישת הידע נעשית ע"י הרצאות תאורטיות, בשילוב פעילויות אינטראקטיביות המסייעות בהבנה ובהטמעת החומר הנלמד, תרגול וסימולציות ובאמצעות למידה עצמאית

איפה משתלבים בשוק העבודה אחרי הקורס?

לרוב החברות היום יש אחוז ניכר של מומחי דאטה סיינס מתוך הצוות הטכנולוגי לרבות חברות הייטק, חברות טכנולוגיות רפואיות, חברות ביטוח, פיננסים, ארגונים ממשלתיים, בתי חולים, חברות ייעוץ חברות העוסקות בביג דאטה ועוד.

תעודות והסמכות

דרישות לזכאות תעודת גמר:

  • השתתפות בלפחות 85% משעות הקורס
  • נוכחות חובה בהגשת פרויקט הגמר
  • חובת הגשת כל מטלות הקורס וקבלת ציון עובר (מבחנים, תרגילים, עבודות, פרויקטים)

שאלות נפוצות על קורס דאטה סיינס

תחום ה-Data Science הוא אחד מהתחומים הצומחים באופן היציב ביותר בתעשיית ההייטק ובעוד שתחומים מסוימים צמחו במהירות אבל נשארו קבועים לאורך זמן, באופן מפתיע התחום צומח באופן קבוע כבר מעל לעשר שנים.

רמת העניין בתחום גבוהה באופן יחסי למשרות אחרות בהייטק, בנוסף לכך, כיום ישנם מעט אוניברסיטאות שמלמדות את המסלול באופן ישיר ולרוב ההכשרה האוניברסיטאית היא יותר תיאורטית מאשר מעשית ולכן נדרשת עוד הכשרה בנוסף לאקדמיה.

אנחנו ב-INT פיתחנו תוכנית מלאה שכוללת את הרכיבים החשובים ביותר כדי להצליח היום בתעשייה.  בנוסף הגישה הלימודית מכוונת פרויקטים, עבודה מעשית ומיומנויות מחקר ולימוד עצמי כך שהבוגרים שלנו מקבלים את האינקובציה הטובה ביותר שיכולנו ליצור עבור ההתפתחות המקצועית שלהם.

משכורת Data Science מתחיל בדרך כלל נעה בין 18 – 23 אלף. לרוב קשה להגיע למשרת Data Science מתחיל ולכן הרבה אנשים שהם חסרי רקע אקדמי מתאים יאלצו להתפשר במשכורת עבור השנה – שנתיים הראשונות.

לעומת זאת, בעלי רקע בהנדסה, מדעי המחשב ו/או ניסיון קודם בתעשייה יכולים להתחיל במשכורות הללו.

כן, נדרש תואר ראשון במדעים מדויקים ואנגלית ברמה גבוהה.

התפקיד המרכזי של מדען הנתונים הוא להיות אחראי על ניתוח והסקת מסקנות  מהנתונים בחברה, בדרך כלל יש שלושה סוגים של מדעני נתונים בחברות השונות כאשר לרוב ההבחנה היא תחת מי יושב צוות מדעני הנתונים

– מדען נתונים בחברה שליבת המוצר שלה כוללת למידת מכונה: במקרה זה הצוות יהיה לרוב תחת צוות המחקר ( לדוגמה: מיקרוסופט, פייסבוק, פאלו אלטו נטוורקס וכדומה)

– מדען נתונים בחברה שבה למידת מכונה היא חלק מהיכולות של המוצר בנוסף ליכולות אחרות: במקרה זה יהיו מספר מדעני נתונים בצוותים השונים (לדוגמה: וויקס, בוקינג.קום, אירון סורס)

– מדען נתונים בחברה שאין למידת מכונה במוצר עצמו, במקרה זה תפקיד מדען הנתונים יהיה לרוב אחראי על סיפוק יכולות עסקיות – שיווקיות ( לדוגמה: חברות ביטוח, הוט, יס וכדומה )

לכל אחת מהשלושה יש כמובן מאפיינים שונים, אבל בגדול העבודה היום יומית תהיה

– עבודה מחקרית על ליבת המוצר לשפר את התוצאות ולהוסיף פיטשרים

– עבודה במחלקה הספציפית כדי לתת מענה לדרישות מוצריות שונות  לדוגמה: לשפר את אחוזי הסגירה באתרי תיירות

– לשפר יעדים עסקיים שונים: שיווק יעיל יותר, ניתוח עזיבת לקוחות וכדומה

 

באופן כללי ההנחה הרווחת היא שאנליסט לא מקודד אלא משתמש בפתרונות לניתוח מידע כמו Tablue, Power BI.

במקום ליצור תהליך אוטומטי לניתוח המידע הוא מנתח אותו באופן ידני, בימינו הגבול בניהם מטשטש, מאוד נפוץ לראות אנליסטים שמתכנתים בעצמם ויוצרים אוטומציה של האנליזה.
הבדל שעדיין נשמר הוא השימוש במודלים פרדקטיביים: יכולות מחקריות: חשיבה עצמאית, להתעדכן במאמרים או כתבות, הבנה של האספקטים התיאורטיים יכולות ניתוח מידע כמו; ניתוח כמותי, סטטיסטי – הסתברותי של מידע בעזרת קוד, בדיקת מודלים, יצירת פיטשרים. ויכולות אופרטיביות: יכולות תכנות גבוהות, עבודה עם תשתיות מידע ( DevOps )

מבחינת חלוקת הזמן הנדרש זה בערך 40% עבור אופרציה, 40% עבור ניתוח המידע ו- 20% יכולות מחקריות

לכן, צוות בדרך כלל יכלול לפחות מדען נתונים אחד עם רקע בתכנות, מדען נתונים עם רקע בניתוח מידע או ג'וניור, ומדען נתונים מנוסה שיכיר את הספרות הרלוונטית

תוכנית לימודים

1
צורה
Mathematics

שלב ראשון

• Probability
• Statistics
• Linear algebra
• Calculus

המתמטיקה מהווה את הבסיס ליכולות של מדען הנתונים, היא הלוגיקה והגיון מאחורי המודלים האלגורתמיים. בחלק זה נלמד באופן פרקטי את הנושאים המרכזיים הדרושים להבנת האלגוריתמים והשימושים בהם שאותם נלמד בחלקים המתקדמים יותר

2
צורה
Basic Machine Learning

שלב שני

• Linear models
• Decision tree
• k-nearest neighbours classifier
• Random forest
• XGboost

בחלק זה נכיר את המודלים הבסיסיים של למידת מכונה – כיצד לכתוב קוד לצורך בנית המודלים ואת הרקע התיאורטי שעומד מאחוריהם, בנוסף נכיר שיטות בסיסיות להערכת מודלים ושימוש בטכניקות בסיסיות של חלוקת המידע כדי ליצור מודלים עמידים יותר

3
צורה
Advance Python and Machine learning concepts

שלב שלישי

במסגרת הפרק, נכיר ספריות כגון Pandas וספריות דומות כדי לעבד את המידע לצורך ניקוי והכנת המידע ללמידת מכונה.
בנוסף, נשתמש בכלים שלמדנו לפני כדי לבדוק ולשפר את המודלים שלנו באמצעות כלים כגון Feature Engeneering, Data Cleaning

4
צורה
Basic Neural Network and Deep Neural Network

שלב רביעי

• recurrent neural network
• convolutional neural network
• Voice recognition
• Cross-validation
• NLP
• TensorFlow
• PyTorch

בחלק זה נלמד על אבני הבסיס של המודלים המתקדמים ללמידת מכונה עמוקה שעל בסיסה מתבססים המודלים המורכבים יותר

5
צורה
Advanced ML & Deep Neural Network

שלב חמישי

• Evaluation
• Future Engineering
• Data cleaning
• advance overfitting

במסגרת הפרק, נלמד על ארכיטקטורות של מודלים עמוקים שמשמשות לשימושים שונים כגון NLP, Image Processing, Time Series Analysis. ואספקטים מתקדמים ופרקטיים יותר בלמידת מכונה שמטרתם שיפור המודלים והתוצאות בשטח.

6
צורה
פרויקטי גמר

שלב שביעי

  • Final Project
  • Industry Project

חלק זה הינו גולת הכותרת של ההכשרה!
נלמד כיצד להתמודד עם אתגרים מציאותיים מהעולם וכיצד לחבר נכון את הכלים שרכשנו כדי ליצור פתרונות פרקטיים.

7
צורה
Advanced Topics

שלב שישי

• model Interoperability
• Transfer learning
• generative adversarial networks (GANs)
• Deep reinforcement learning

לאחר סיום הפרויקט וההתמודדות עם האתגרים שנתקל בהם בעולם האמתי, נעמיק לשיטות מודרניות לפתרון האתגרים הללו באמצעות מודלים מתקדמים המשמשים את אנשי המקצוע השונים בתעשיית ההיי-טק.

8
צורה
Industry Project

שלב שביעי

החלק המסכם של ההכשרה הוא פרויקט שבו נתלווה לצוות קיים מהתעשייה, נלמד על האתגרים שלו ונייצר מענה לאתגרים ממשיים העולים מן השטח .

המרצים בקורס

יגאל ווינברגר
יגאל ווינברגר
מדען נתונים מומחה בעל למעלה מתשע שנות ניסיון ומוביל מחקר עטור פרסים של Machine Learning & Deep Learning. עובד בחברות הגדולות ברחבי העולם כגון Intel Corporation, Palo Alto Networks, Verint Systems, סטארטאפים מצליחים כגון IntSight Cyber Intellegance ו-DataXcelerator Research Group ומכונים אקדמיים מובילים כמו אוניברסיטת תל אביב. במהלך השנים זכה יגאל בפרסים רבים, כמו פרויקט Data Science הטוב ביותר לשנת 2017 בפאלו אלטו נטוורקס (7,000 עובדים), הסטארט-אפ הטוב ביותר ב-CashLess מתוך 20 מתחרים. הפתרון החדשני השני הטוב ביותר לשנת 2015 ב-Verint Systems (3,900 עובדים) ופרסם מאמרים מרובים בכתבי עת אקדמיים מובילים. מוכר בהפגנת כישרון טבעי למנהיגות צוות, כמו גם ביצירת מוצרי אבטחת סייבר חדשניים ואלגוריתמים של למידת מכונה, בעל היסטוריה ניתנת לאימות של תרומה ישירה לצמיחה והתרחבות החברה לאורך הקריירה. בעל מוקדים מקצועיים הכוללים פיתוח אלגוריתמים, יזמות, פיתוח מוצרים, ניתוח נתונים, תכנות, פיתוח תוכנה, עיבוד תמונה, אבטחת סייבר ופתרונות טכנולוגיים כוללים. כיום יגאל ראש צוות מדעי הנתונים ב-IntSights Cyber Intelligence ומוביל מחקר מדעי נתונים ולמידת מכונה כחלק מצוות מו"פ אבטחת סייבר.
לקביעת שיחת ייעוץ חינם

    שיחה עם נציג

    דילוג לתוכן