תכנון המשכיות עסקית ותוכנית התאוששות מאסון (DR)

אתם צופים במסמכי העזרה של Apigee Edge.
כניסה למסמכי העזרה של Apigee X.
info

‏Apigee היא פלטפורמה מבוססת-ענן לדיירים מרובים בשירות עצמי, שפועלת בתצורה יתירה (live/live) במספר מרכזי נתונים במספר אזורים בעולם. הפלטפורמה מבוססת-הענן של Apigee מתבססת על Google Cloud Platform ‏ (GCP) ו-Amazon Web Services ‏ (AWS). כחלק מהשירותים שאנחנו מפתחים ב-GCP וב-AWS, אנחנו משתמשים במספר מרכזי נתונים בכל אזור ומספקים שירות לתעבורת נתונים פעילה של הלקוחות שלנו במספר מרכזי הנתונים האלה. אין לנו מרכז נתונים 'פעיל' ומרכז נתונים 'בסטביי' (או 'משני' או 'חלופי'). יש לנו שני מרכזי נתונים (או יותר) שמטפלים כל הזמן ובאופן סימולטני בתעבורת הנתונים של הלקוחות בכל אזור בעולם.

תוכנית BCP/DR

תוכנית התאוששות מאסון ותכנון רצף עסקי (BCP/DR) של Apigee היא תוכנית ברמת הפלטפורמה, והיא לא מכילה משימות מפורטות ללקוחות ספציפיים. במקום זאת, הפלטפורמה מוגדרת לעבד בקשות לנתוני לקוחות ללא קשר להפרעות ולשבתות. הנתונים ימשיכו לזרום גם אם מרכז נתונים שלם יהיה במצב אופליין. אם אזור שלם יהיה במצב אופליין, לקוח באזור אחד עלול להיתקל בהפסקה זמנית בשירותי עיבוד ה-API. ללקוחות שמחפשים יותר משירותים יתירים 'באזור', Apigee מציעה רמה גלובלית של מרכזי נתונים יתירים, שבהם ניתן לתת שירות לתנועה בכמה אזורים או מדינות. כך, אם אזור שלם יוצא אופליין, הנתונים עדיין יתקבלו.

שירותי לקוחות באזור יחיד לא מועברים באופן אוטומטי לאזור אחר בגלל הגבלות גיאוגרפיות אפשריות על עיבוד הנתונים ועל הגישה אליהם. ‏Apigee מארחת שירותים ללקוחות באזור שצוין על ידי הלקוח. יכול להיות שיש תקנות ספציפיות או התחייבויות של לקוחות למשתמשים שלהם לגבי מיקומים גיאוגרפיים של נתונים, ולכן Apigee לא תעביר שירותים באופן אוטומטי לאזור חלופי, כי הפעולה הזו עלולה לסכן את ההתחייבויות של Apigee ללקוחות שלה או את ההתחייבויות של לקוחות Apigee ללקוחות שלהם.

Apigee לא משתפת את תוכנית ה-BCP/DR המלאה עם לקוח ספציפי, כי היא מכילה מידע רגיש פנימי של Apigee והפניות ללקוחות שלנו. מדיניות הפרטיות שלנו אוסרת לשתף את תוכנית ה-BCP/DR של הפלטפורמה עם לקוחות ספציפיים, כי ייתכן שהיא תחשוף שמות של לקוחות אחרים. אנחנו מציעים את אותה רמת פרטיות לכל לקוח.

ניהול תוכניות BCP/DR

צוות אבטחת המידע של Apigee אחראי על הפיקוח על התוכנית לניהול אירועי אבטחה, ומפקד אירוע שמתחלף כל כמה זמן אחראי על הניהול והפתרון של כל האירועים. למפקד התקרית יש צוות תפעולי וצוות מהנדסים שזמינים תמיד, וכן ספרים של תרחישי פעולה לכל הפעולות שעשויות להיות נדרשות.

בדיקת BCP/DR

ב-Apigee מתבצעים תהליכים תפעוליים שתומכים בבדיקות BCP/DR של הפלטפורמה בתדירות גבוהה יותר מאשר הבדיקות השנתיות המלאות של BCP/DR. בכל חודש, מערכת Apigee מבצעת תנודות עומסים מהסביבה הפעילה שלנו בזמן שאנחנו מבצעים עדכונים במערכות שמריצות את השירות. התהליך הזה כולל השבתה של מערכות של מרכז נתונים שלם, בזמן שהעומס מטופל על ידי מרכז הנתונים המקביל. במהלך התהליך, אחרי ביצוע העדכונים, מפעילים מחדש את מרכז הנתונים הראשון והשירותים שוב פועלים באופן פעיל כדי לוודא שלא נוצרו בעיות. לאחר מכן מרכז הנתונים של השותף יושבת כדי לבצע את אותם עדכונים, ואז הוא יופעל שוב. מערכת Apigee משתמשת בכלים ובשיטות כדי לנצל את כל התעבורה ולשלוח אחוז קטן מהתעבורה לשירותים שעודכנו לאחרונה, כדי לבדוק אם יש בעיות או שגיאות לפני שהיא חוזרת לעיבוד עומס מלא.

התהליך התפעולי העקבי הזה חורג מהסטנדרט התפעולי של 'בדיקת' החוסן השנתית של השירות, ומגדיר אותו כמשימה תפעולית שמתבצעת בתדירות גבוהה יותר.

בנוסף לתהליכים התפעוליים שמפורטים למעלה, Apigee גם עורכת תרגילי BCP/DR במצב שולחני לפחות פעם בשנה, שבהם חברי צוות ההנדסה והתפעול מתאספים יחד עם יחידות עסקיות אחרות של Apigee כדי לדמות באופן לוגי בעיות, תגובות והשפעה של החלטות שקיבלנו בתרחיש אסון מדומה. כך הצוות שלנו מקבל הדרכה וניסיון נוספים בתוכניות ה-BCP/DR הרחבות יותר של הארגון כולו, בנוסף לשירות עצמו.

בבדיקות ה-BCP/DR שמבוצעות על ידי Apigee לא נעשה שימוש ב'תרגילי חלוקת עומסים' או ב'מיקומים משניים', כי כל זה מובנה במערכת שפועלת.

ב-Apigee יש ספרים של Playbooks לשימוש של כל צוותי התפעול וההנדסה. אנחנו בודקים ומעדכנים את ספרי הדרכה האלה לפחות פעם בשנה, ומשתמשים בהם בכל תרגילי הבדיקה וההדרכה שלנו בנושא תוכנית עסקית להתאוששות מאסון (BCP) או תוכנית התאוששות מאסון (DR).

ב-Apigee לא משתפים דוחות בדיקות של תוכנית BCP או תוכנית DR עם לקוחות ספציפיים, כי הבדיקות האלה מתבצעות ברמת הפלטפורמה ולא ברמת הלקוח. אנחנו משתפים עם המבקרים של צד שלישי את התוצאות של המשימות התפעוליות שלנו ואת דוחות הבדיקות השנתיים של תרחישי תגובה, והם מהווים את הבסיס לבדיקה של המבקר לגבי תאימות שלנו לדרישות PCI,‏ HIPAA, דרישות חוזיות ודרישות אחרות.

בדיקות BCP/DR של לקוחות

מומלץ ללקוחות לכלול את שירותי Apigee Edge בתוכניות ה-DR שלהם. הלקוחות יכולים, וצריכים, לבדוק איך Apigee יכולה לנתב מחדש את התנועה לפי הצורך כדי שהם יוכלו לשמור על שירותי משתמשי הקצה גם במהלך הפסקה זמנית בשירות של מרכז הנתונים של הלקוח או אירוע אסון אחר. עם זאת, רמת הבדיקה הזו לא נכללת בתוכנית התאוששות מאסון של Apigee. אנחנו ממליצים ללקוחות לבצע בדיקות BCP/DR באפליקציות שלהם ולכלול את Apigee Edge בבדיקה.

RTO/RPO

ל-Apigee אין יעדי נקודת התאוששות ויעדי משך התאוששות (RPO/RTO) ללקוחות שלנו, או בחוזים שלנו שקשורים לפעילויות BCP/DR. הסכמי רמת השירות שלנו הם המקבילה בענן לנקודות הנתונים של RTO/RPO. Apigee הוא שירות יתיר מבוסס-ענן, שבו גם שירותי הניהול וגם שירותי זמן הריצה תוכננו עם שירותים יתירים שפועלים. לכן, אפשר להתייחס ל-RTO ול-RPO כאל 'זמן אמת'. לקוחות עם שירות באזור יחיד מקבלים מינימום של שירותים יתירים במרכזי נתונים שונים באותו אזור. לקוחות שרוצים רמות יתירות גבוהות יותר יכולים לבחור בשירותים במספר אזורים.

תוכנית למקרה מגפה

ב-Apigee יש תוכנית למקרה מגפה כחלק מהתהליכים והתוכניות הכוללים שלנו ל-BCP/DR. מכיוון ש-Apigee הוא שירות שמתארח בענן, אין צורך בניהול ידני של מרכז הנתונים. לצורך תפעול עסקי, כמו תמיכה, ל-Apigee יש צוות תמיכה גלובלי שפועל מסביב לשעון במספר משרדים ומיקומים מרוחקים. אם מגפה באזור מסוים בעולם תשפיע על אחד ממיקומי התמיכה שלנו, הצוותים במשרדים אחרים יקבלו התראה ויעבדו במשמרות שבדרך כלל מטופלות על ידי המשרד המושפע. בשירותים עסקיים אחרים, כמו מכירות, כוח העבודה מפוזר ברחבי העולם. כל הצוותים ב-Apigee מצוידים לעבודה מרחוק במקרה הצורך. הכלים שבהם נעשה שימוש ב-Apigee מבוססים על ענן, והם מתאימים באופן טבעי לתוכנית תגובה למגפה.

עדכונים

צוות Apigee בודק ומעדכן את תוכנית ה-BCP/DR שלנו לפחות אחת לשנה. המידע שנאסף מאירועים, משינויים במוצרים, מסטנדרטים של התחום, מפעילויות של ניתוח סיכונים ומבדיקות של תוכנית עסקית להתאוששות מאסון או של מסדי נתונים משמש לעדכון התוכנית.

ניתוח השפעות על העסק והערכות סיכונים

Google מבצעת מדי שנה ניתוח של ההשפעה העסקית והערכת סיכונים. התוצאות של ה-BIA וה-RA מקבלות עדיפות ומתוועדות במערכת למעקב אחר בעיות.