תכנון המשכיות עסקית ותוכנית התאוששות מאסון (DR)

כרגע מוצג התיעוד של Apigee Edge.
כניסה למסמכי התיעוד של Apigee X.
מידע

Apigee היא פלטפורמה מבוססת-ענן בשירות עצמי שפועלת בריבוי דיירים, ופועלת בתצורה יתירה לחלוטין (פעילה/פעילה) במרכזי נתונים מרובים במספר אזורים בעולם. ב-Apigee נעשה שימוש ב-Google Cloud Platform (GCP) וב-Amazon Web Services (AWS) לפלטפורמה מבוססת הענן שלנו. במסגרת השירותים שאנחנו מפתחים ב-GCP וב-AWS, אנחנו משתמשים במספר מרכזי נתונים בכל אזור ובתעבורה פעילה של שירותים עבור הלקוחות שלנו במרכזי הנתונים המרובים האלה. אין לנו מרכז נתונים 'פעיל' ומרכז נתונים 'בהמתנה' (או 'משני' או 'מעבר לגיבוי'). יש לנו שני מרכזי נתונים (או יותר) שמספקים שירות ברציפות ובו-זמנית לתנועת הלקוחות בכל אזור בעולם.

תוכנית BCP/DR

Apigee Business Continuity Planning and Disaster recovery (BCP/DR) היא תוכנית שפועלת בכל הפלטפורמה ולא מכילה משימות מפורטות ללקוחות פרטיים. במקום זאת, הפלטפורמה מוגדרת לעבד בקשות לנתוני לקוחות, ללא קשר לשיבושים ולהפסקות זמניות בשירות. הנתונים ימשיכו לזרום גם כשמרכז הנתונים כולו לא יהיה מחובר לאינטרנט. אם אזור שלם לא יהיה מקוון, לקוח באזור יחיד עלול לחוות הפסקה זמנית בשירות של שירותי עיבוד ה-API. ללקוחות שמחפשים יותר שירותים יתירים מסוג "באזור", ב-Apigee יש רמה יתירה גלובלית של מרכזי נתונים יתירים שבהם ניתן לספק שירות לתעבורת נתונים במספר אזורים או מדינות, כך שאם אזור שלם עובר למצב אופליין, הנתונים ממשיכים לזרום.

לא מתבצעת העברה אוטומטית של שירותי לקוחות באזור יחיד לאזור אחר, בגלל הגבלות גיאוגרפיות אפשריות על עיבוד הנתונים ועל הגישה אליהם. Apigee מארחת שירותים ללקוחות באזור שהלקוח ציין. מכיוון שעשויות להיות תקנות ספציפיות או מחויבויות של הלקוחות למשתמשים במיקומים גיאוגרפיים של נתונים, Apigee לא תעביר שירותים באופן אוטומטי לאזור חלופי. מצב כזה עלול לפגוע בהתחייבויות של Apigee ללקוחות שלה או במחויבויות של הלקוחות של Apigee ללקוחות שלהם.

Apigee לא משתפת את תוכנית BCP/DR המלאה עם אף לקוח אישי, כי היא מכילה מידע רגיש פנימי של Apigee והפניות ללקוחות שלנו. מדיניות הפרטיות שלנו מונעת לשתף את תוכנית BCP/DR של הפלטפורמה עם לקוחות ספציפיים שעלולים לחשוף שמות של לקוחות אחרים. אנחנו מציעים לכל לקוח את אותה רמת פרטיות.

ניהול BCP/DR

צוות Apigee Information Security אחראי על הפיקוח על תוכנית 'עמידות עסקית', ואילו מפקד התקרית המתחלף אחראי על הניהול והפתרון של כל האירועים. למפקד התקרית יש אנשי צוות תפעוליים ומהנדסים שמוכנים לפעול בכל עת, וכן מדריכים לכל הפעולות שצריך לבצע.

בדיקת BCP/DR

Apigee מבצעת תהליכים תפעוליים שתומכים בבדיקות BCP/DR של הפלטפורמה בתדירות גבוהה יותר, בהשוואה לבדיקת BCP/DR השנתית המלאה שלנו באמצעות בדיקות BCP/DR. בכל חודש, Apigee מבצעת תנודות טעינה מהסביבה הפעילה/החיה שלנו, בזמן שאנחנו מבצעים עדכונים למערכות שמפעילות את השירות. התהליך הזה כרוך בהסרת מערכות של מרכז נתונים אחד שלם, בזמן שהעומס מטופל על ידי מרכז הנתונים של הצד השני. בתהליך הזה, אחרי ביצוע עדכונים, מרכז הנתונים הראשון נטען מחדש, והשירותים מופעלים מחדש או פעילים שוב כדי לוודא שלא היו בעיות. אחר כך, מרכז הנתונים של האפליקציות להשוואה מורידים את אותם העדכונים ואז חוזר שוב לאינטרנט. ב-Apigee משתמשים בכלים ובשיטות כדי לרוקן את תעבורת הנתונים, ושולחים אחוז קטן מתנועת הגולשים אל שירותים שעודכנו לאחרונה כדי לבדוק אם יש בעיות או שגיאות לפני החזרה לעיבוד של העומס המלא.

התהליך התפעולי העקבי הזה חורג מ'בדיקת' העמידות הדו-שנתית המקובלת של השירות שלנו, בכך שהוא משימה תפעולית שמתרחשת בתדירות גבוהה יותר.

בנוסף לתהליכי התפעול המתוארים למעלה, Apigee מבצעת גם תרגילי BCP/DR שולחני לפחות פעם בשנה, שבהם חברי צוות ההנדסה והתפעול נפגשים עם יחידות עסקיות אחרות של Apigee כדי לבצע הדמיה לוגית של בעיות, תגובות והשפעות של החלטות שמתקבלות בתרחיש אסון מדומה. ההדרכות האלה מספקות לצוות שלנו הדרכה נוספת וניסיון נוסף על תוכניות BCP/DR ברמת הארגון בכללותה, בנוסף לשירות עצמו.

בבדיקת BCP/DR שמתבצעת על ידי Apigee, לא נעשה שימוש ב'תרגילי כשל' או ב'מיקומים משניים' כי כל אלה מובנים במערכת הריצה.

Apigee מנהלת את המדריכים עבור כל צוותי התפעול וההנדסה. המדריכים האלה נבדקים ומעודכנים לפחות פעם בשנה, והם משתמשים בכל תרגילי ההכשרה והבדיקות BCP/DR.

Apigee לא משתפת דוחות של בדיקות BCP/DR עם לקוחות פרטיים, כי הבדיקות האלה מתבצעות ברמת הפלטפורמה ולא ברמת הלקוח. אנחנו משתפים עם מבקרים חיצוניים את תוצאות המשימות התפעוליות ואת הדוחות השנתיים שלנו לבדיקות תרגול. הנתונים האלה הם הבסיס לבדיקת התאימות שלנו ל-PCI, ל-HIPAA, לחוזים ולדרישות אחרות.

בדיקות BCP/DR של לקוחות

ללקוחות מומלץ להיות תוכניות DR משלהם שכוללות שירותי Apigee Edge. הלקוח יכול וצריך לשקול איך Apigee יכולה להפנות את תעבורת הנתונים לפי הצורך כדי שהלקוחות יתחזקו שירותים למשתמשי קצה, גם במהלך הפסקה זמנית בשירות של מרכז נתוני לקוחות או באירוע אסון אחר. עם זאת, רמת הבדיקה הזו לא נכללת בתוכנית Apigee DR. אנחנו ממליצים ללקוחות לבצע בדיקות BCP/DR באפליקציות שלהם ולכלול את Apigee Edge.

RTO/RPO

ל-Apigee אין נקודות התאוששות ויעדי זמן התאוששות (RPO/RTO) עבור הלקוחות שלנו או בחוזים שלנו הקשורים לפעילויות BCP/DR. הסכמי רמת השירות שלנו הם המקבילה בענן של נקודות הנתונים של RTO/RPO. Apigee הוא שירות יתיר מבוסס-ענן, עם תכנון של שירותי ניהול וזמן ריצה יחד עם שירותים פעילים יתירים, RTO ו-RPO יכולים להיראות שניהם כ'זמן אמת'. לקוחות באזור יחיד מקבלים מינימום שירותים יתירים במרכזי נתונים שונים עם אותו אזור. לקוחות שמעוניינים לרמות גבוהות יותר של יתירות יכולים לבחור בשירותים במספר אזורים.

תוכנית להתמודדות עם המגפה

Apigee כוללת תוכנית להתמודדות עם משבר הקורונה כחלק מתוכנית ותהליכי BCP/DR הכוללים שלנו. מכיוון ש-Apigee הוא שירות מתארח בענן, אנשים פרטיים לא נדרשים לנהל את מרכז הנתונים. עבור פעולות עסקיות כמו תמיכה, Apigee מפעילה צוות תמיכה גלובלי מסביב לשעון במספר משרדים ומיקומים מרוחקים. אם מגפה באזור אחד בעולם משפיעה על אחד ממיקומי התמיכה שלנו, צוות העובדים במשרדים אחרים יקבל התראה וימכסה את המשמרות שטופלו בדרך כלל במשרדים המושפעים. בשירותים עסקיים אחרים, כמו מכירות, כוח העבודה מחולק באופן גלובלי. כל הצוותים ב-Apigee מתאימים לעבודה מרחוק במידת הצורך. הכלים ב-Apigee מבוססים על הענן ומשתלבים באופן טבעי בתוכנית תגובה למגיפה.

עדכונים

Apigee בודקת ומעדכנת את תוכנית BCP/DR שלנו לפחות פעם בשנה. אנחנו משתמשים במידע שנאסף על סמך אירועים, שינויים במוצרים, תקני תעשייה, פעילויות של ניתוח סיכונים ובדיקות BCP/DB כדי לעדכן את התוכנית.

ניתוח השפעות עסקיות והערכות סיכונים

Google עורכת ניתוח נתונים עסקיים והערכת סיכונים כל שנה. התוצאות של ה-BIA וה-RA מקבלות עדיפות ומתועדות במערכת המעקב אחר הבעיות.