בשנת 2003 יצרו בחברת גוגל תפקיד חדש, בשם SRE (קיצור של Site reliability engineering). מטרת התפקיד היא ליצור אתרים בעלי סקיילביליות ואמינות גבוהים יותר, באמצעות אוטומציות לעדכונים של מערכות רלוונטיות (נקרא גם מהנדס פרודקשן לעתים). אולם מה זה באמת SRE, ואיך זה קשור ל-DevOps? על כך במאמר זה.
מה עושה SRE
לתחום ה-SRE אין הגדרה ממצה, אלא מדובר בגישה ביחס להגברת אמינות ויציבות בתוכנה. עם זאת, הוגה ה-SRE, בן טריינור (Ben Treynor) תיאר זאת כך (בתרגום חופשי): "מה שקורה כאשר מהנדסי מבצעים משימות תשתית". נכון לשנת 2021, בגוגל כבר היו יותר מ-3,000 אנשי SRE, המחולקים לקבוצות הנעות בין 50 ל-300 מהנדסים. בבדיקה שנעשה בשנת 2021, למעלה מ-20% מהחברות הגדולות שנבדקו, אימצו את מודל ה-SRE אל תוך מתודת הפיתוח שלהן.
בגדול, הבעיה ש-SRE נועד לפתור היא כזאת: צוותי פיתוח תמיד רוצים ליצור פיצ'רים ופיתוחים חדשים. מנגד, צוותי התשתית והמידע בחברה (IT) רוצים לוודא שאותם פיתוחים לא יפגעו בקוד, ולכן בולמים את ההתקדמות של המפתחים. משום כך, הצוותים "מתנגשים" האחד בשני; כאן באופן מסורתי נכנסת גישת ה-DevOps, אשר נועדה לנהל ולטייב את שיתוף הפעולה בין הצדדים, על ידי יצירת נהלים, שיפור יעילות הפיתוח. ה-SRE לעומת זאת, מתייחס יותר לתכל׳ס של הדברים: איש ה-SRE מחלק את התחזוקה, הפיתוח והעדכון למשימות, ומקצה אותן לצוותי התפעול, בצורה כזאת שהדברים יעבדו באופן יציב ויעיל. גישת ה-SRE נותנת ודאות לתהליכי פיתוח, בכך שצוותי ה-SRE עוסקים באופן שוטף אחר פיקוח האמינות של המוצר.
תפקיד ה-SRE
ה-SRE הוא תפקיד יחסית מתפתח ובמרבית החברות, פונקציית ה-SRE תבוצע על ידי אנשי הדבאופס; לעומת זאת, בחברות גדולות מאוד (כגון גוגל, פייסבוק, לינקדאין וכדומה), יהיו אנשים SRE "פרופר", שיהיו אחראים על ההיבט של תקינות ואמינות המוצר.
מה שעושה SRE בפועל הוא את הדברים הבאים: לוודא את הקוד ואת השרתים, כך שהכל עובד כראוי; לחלק משימות תחזוקה למפתחים, כך שהמערכת תפעל בצורה תקינה ואמינה; לתזמן את התוספת של פיצ'רים חדשים, ולעדכן את התקנון של המוצר בהתאם; לנטר לאגים, שגיאות ותקלות בהתאם לאינדיקטורים מסוימים; תכנון זמן לצוותי הפיתוח, אותו עליהם להקדיש לבאגים ותקלות; השתתפות בפיתוח אוטומציות תחזוקה לחלקים שונים במערכות ועוד.
איש SRE מחזיק ידע הן בפיתוח וכתיבת קוד, והן בתפעול. בקורס דבאופס אצלנו במכללה, לומדים היבטים הקשורים לתפקיד ה-SRE. למעשה, קורס דבאופס במכללת Int, הינו המסלול המקיף ביותר ללימודי דבאופס, עם התמחות ב-Cloud בשילוב SRE.
מעוניינים לדעת יותר? קראו על קורס ה Devops שלנו