การวางแผนความต่อเนื่องทางธุรกิจและการฟื้นฟูจากภัยพิบัติ

คุณกำลังดูเอกสารประกอบของ Apigee Edge
ไปที่เอกสารประกอบของ Apigee X
ข้อมูล

Apigee คือแพลตฟอร์มระบบคลาวด์แบบบริการตนเองแบบหลายกลุ่มผู้ใช้ที่ทำงานในการกำหนดค่าที่ซ้ำซ้อนทั้งหมด (ใช้จริง/จริง) ในศูนย์ข้อมูลหลายแห่งในหลายภูมิภาคทั่วโลก Apigee คือ Google Cloud Platform (GCP) และ Amazon Web Services (AWS) สำหรับแพลตฟอร์มในระบบคลาวด์ของเรา ส่วนหนึ่งของบริการที่เราสร้างขึ้นบน GCP และ AWS คือเราใช้ศูนย์ข้อมูลหลายแห่งภายในแต่ละภูมิภาคและให้บริการการรับส่งข้อมูลแบบเรียลไทม์สำหรับลูกค้าในศูนย์ข้อมูลหลายแห่งเหล่านี้ เราไม่มีศูนย์ข้อมูลแบบ "สด" และศูนย์ข้อมูล "สแตนด์บาย" (หรือ "รอง" หรือ "เฟลโอเวอร์") เรามีศูนย์ข้อมูล 2 แห่ง (ขึ้นไป) ที่ให้บริการการเข้าชมของลูกค้าอย่างต่อเนื่องและพร้อมกันในแต่ละภูมิภาคทั่วโลก

แผน BCP/DR

การวางแผนความต่อเนื่องทางธุรกิจและการกู้ข้อมูลคืนหลังจากภัยพิบัติของ Apigee (BCP/DR) เป็นแผนที่ใช้ทั่วทั้งแพลตฟอร์มและไม่มีงานแบบละเอียดสำหรับลูกค้าแต่ละราย แต่จะกำหนดค่าแพลตฟอร์มให้ประมวลผลคำขอข้อมูลลูกค้า โดยไม่คำนึงถึงการหยุดชะงักหรือการหยุดทำงาน ข้อมูลจะยังคงไหลต่อไปแม้ว่าศูนย์ข้อมูลทั้งแห่งจะออฟไลน์อยู่ก็ตาม หากทั้งภูมิภาคต้องออฟไลน์ ลูกค้าในภูมิภาคเดียวอาจพบปัญหาบริการประมวลผล API หยุดทำงาน สำหรับลูกค้าที่กำลังมองหาบริการที่ซ้ำซ้อนมากกว่า "ในภูมิภาค" Apigee คือศูนย์ข้อมูลที่ซ้ำซ้อนกันทั่วโลก ซึ่งสามารถให้บริการการรับส่งข้อมูลได้ในหลายภูมิภาคหรือประเทศ ดังนั้นหากทั้งภูมิภาคออฟไลน์ ข้อมูลก็จะยังคงไหลผ่าน

ระบบจะไม่โอนฝ่ายบริการลูกค้าของภูมิภาคเดียวไปยังภูมิภาคอื่นโดยอัตโนมัติ เนื่องจากข้อจำกัดทางภูมิศาสตร์เกี่ยวกับการประมวลผลข้อมูลและการเข้าถึง Apigee ได้โฮสต์บริการสำหรับลูกค้าในภูมิภาคที่ลูกค้าระบุ เนื่องจากอาจมีระเบียบข้อบังคับหรือคำมั่นสัญญาของลูกค้าที่เจาะจงกับผู้ใช้เรื่องสถานที่ตั้งทางภูมิศาสตร์ของข้อมูล Apigee จะไม่ย้ายบริการไปยังภูมิภาคอื่นโดยอัตโนมัติ เนื่องจากอาจส่งผลเสียต่อความมุ่งมั่นของ Apigee ต่อลูกค้าหรือสัญญาผูกมัดที่ลูกค้า Apigee ได้มีส่วนร่วม

Apigee ไม่ได้แชร์แผน BCP/DR ทั้งหมดกับลูกค้าแต่ละราย เนื่องจากมีข้อมูลที่ละเอียดอ่อนภายในของ Apigee และการอ้างอิงถึงลูกค้า นโยบายความเป็นส่วนตัวของเราป้องกันการแชร์แผน BCP/DR ของแพลตฟอร์มกับลูกค้าแต่ละรายที่อาจเปิดเผยข้อมูลชื่อลูกค้ารายอื่นๆ เรามอบความเป็นส่วนตัวในระดับเดียวกันนี้แก่ลูกค้าแต่ละราย

การจัดการ BCP/DR

ทีมรักษาความปลอดภัยของข้อมูลของ Apigee มีหน้าที่ดูแลโปรแกรมความยืดหยุ่นของธุรกิจ ในขณะที่ผู้บัญชาการเหตุการณ์หมุนเวียนมามีหน้าที่จัดการและแก้ไขเหตุการณ์ทั้งหมด ผู้บัญชาการเหตุการณ์มีบุคลากรด้านปฏิบัติการและวิศวกรรมพร้อมให้บริการตลอดเวลา พร้อมกับ Playbook สำหรับการดำเนินการทั้งหมดที่ต้องดำเนินการ

การทดสอบ BCP/DR

Apigee คือกระบวนการดำเนินงานที่รองรับการทดสอบ BCP/DR ของแพลตฟอร์มบ่อยกว่าการทดสอบแบบตั้งโต๊ะสำหรับ BCP/DR ประจำปีแบบเต็มรูปแบบ ในแต่ละเดือน Apigee จะปรับเปลี่ยนการโหลดจากสภาพแวดล้อมแบบสด/แบบสดขณะที่เราอัปเดตระบบที่ใช้งานบริการ ขั้นตอนนี้รวมถึงการนำระบบของศูนย์ข้อมูลทั้งระบบออก 1 ระบบในขณะที่ศูนย์ข้อมูลเพียร์จัดการโหลด ในระหว่างขั้นตอนนี้ หลังจากดำเนินการอัปเดตแล้ว ระบบจะสำรองข้อมูลศูนย์ข้อมูลแห่งแรกและให้บริการต่างๆ ในแบบเรียลไทม์เพื่อยืนยันว่าไม่มีปัญหาใดๆ เกิดขึ้น จากนั้นระบบนำศูนย์ข้อมูลระดับเดียวกันออกเพื่ออัปเดตแบบเดียวกัน จากนั้นนำกลับมาออนไลน์อีกครั้ง Apigee ใช้เครื่องมือและเทคนิคต่างๆ ในการระบายการเข้าชม รวมทั้งส่งการเข้าชมจำนวนเล็กน้อยไปยังบริการที่อัปเดตล่าสุดเพื่อตรวจหาปัญหาหรือข้อผิดพลาดก่อนกลับสู่การประมวลผลภาระงานแบบเต็ม

กระบวนการดำเนินงานที่สม่ำเสมอนี้ดีกว่า "การทดสอบ" ความฟื้นตัวปีละ 2 ปีสำหรับบริการของเราตามมาตรฐานอุตสาหกรรม โดยทำให้การดำเนินการดังกล่าวเป็นงานด้านการดำเนินการที่เกิดขึ้นบ่อยขึ้น

นอกเหนือจากกระบวนการดำเนินงานที่อธิบายข้างต้น Apigee ยังจัดฝึก BCP/DR แบบใช้โต๊ะอย่างน้อยปีละครั้ง ซึ่งจะมีการนำสมาชิกในทีมด้านวิศวกรรมและการปฏิบัติงานร่วมกับหน่วยธุรกิจของ Apigee อื่นๆ มาจำลองและแก้ปัญหา การตอบสนอง และผลกระทบของการตัดสินใจในสถานการณ์จำลองภัยพิบัติอย่างมีเหตุผล ซึ่งเป็นการฝึกอบรมและประสบการณ์เพิ่มเติมให้กับบุคลากรของเราเกี่ยวกับแผน BCP/DR ในภาพรวมสำหรับองค์กรโดยรวม นอกเหนือจากการให้บริการ

การทดสอบ BCP/DR ที่ดำเนินการโดย Apigee ไม่ได้ใช้ "การทดสอบเฟลโอเวอร์" หรือ "ตำแหน่งรอง" เพราะทั้งหมดนี้มีอยู่ในระบบที่ทำงานอยู่

Apigee ได้มีการบำรุงรักษา Playbooks ไว้เพื่อให้ทีมปฏิบัติการและทีมวิศวกรรมทั้งหมดใช้งาน Playbook เหล่านี้ได้รับการตรวจสอบและอัปเดตอย่างน้อยทุกปี รวมถึงใช้ในการทดสอบ BCP/DR และการฝึกหัดทั้งหมดของเรา

Apigee ไม่แชร์รายงานการทดสอบ BCP/DR กับลูกค้าแต่ละราย เนื่องจากการทดสอบเหล่านี้ทำในระดับแพลตฟอร์ม ไม่ใช่ระดับลูกค้า เราแชร์ผลลัพธ์ของงานด้านการดำเนินงานและรายงานการทดสอบแบบฝึกหัดบนโต๊ะประจำปีกับผู้ตรวจสอบบุคคลที่สาม และรายงานเหล่านี้เป็นพื้นฐานสำหรับการตรวจสอบการปฏิบัติตาม PCI, HIPAA, สัญญา และข้อกำหนดอื่นๆ ของผู้สอบบัญชี

การทดสอบ BCP/DR ของลูกค้า

เราขอแนะนําให้ลูกค้าสร้างแผน DR ของตนเองเพื่อใช้บริการของ Apigee Edge ลูกค้าสามารถและควรพิจารณาวิธีที่ Apigee สามารถเปลี่ยนเส้นทางการรับส่งข้อมูลตามที่จำเป็นเพื่อให้ลูกค้าใช้ในการดูแลรักษาบริการผู้ใช้ปลายทาง แม้ในขณะที่ศูนย์ข้อมูลของลูกค้าหยุดทำงานหรือเกิดภัยพิบัติอื่นๆ ก็ตาม แต่การทดสอบระดับนี้อยู่นอกขอบเขตของแผน Apigee DR เราขอแนะนําให้ลูกค้าทำการทดสอบ BCP/DR ในแอปพลิเคชันของตนเองและรวม Apigee Edge ในการทดสอบ

RTO/RPO

Apigee ไม่ได้มีวัตถุประสงค์เพื่อจุดกู้คืนและระยะเวลาการกู้คืน (RPO/RTO) สำหรับลูกค้าของเราหรือในสัญญาที่เกี่ยวข้องกับกิจกรรม BCP/DR SLA ของเราเป็นระบบคลาวด์ที่เทียบเท่ากับจุดข้อมูล RTO/RPO เนื่องจาก Apigee คือบริการระบบคลาวด์ซ้ำซ้อน โดยมีทั้งบริการการจัดการและรันไทม์ที่ออกแบบด้วยบริการสดที่ซ้ำซ้อน ระบบจึงมองว่า RTO และ RPO เป็นแบบ "เรียลไทม์" ลูกค้าในภูมิภาคเดียวจะได้รับบริการซ้ำซ้อนขั้นต่ำในศูนย์ข้อมูลต่างๆ ที่อยู่ในภูมิภาคเดียวกัน ลูกค้าที่ต้องการการสำรองข้อมูลในระดับที่สูงขึ้นสามารถเลือกใช้บริการหลายภูมิภาคได้

แผนการระบาด

Apigee ได้รวมแผนสำหรับการแพร่ระบาดไว้ในแผนและกระบวนการ BCP/DR โดยรวม เนื่องจาก Apigee คือบริการที่โฮสต์บนระบบคลาวด์ จึงไม่มีข้อกำหนดให้บุคคลธรรมดาจัดการศูนย์ข้อมูล สำหรับการดำเนินธุรกิจ เช่น การสนับสนุน Apigee คือมีทีมสนับสนุนทั่วโลกทุกวันตลอด 24 ชั่วโมงในทุกสำนักงานและในสาขาที่ห่างไกล หากโรคระบาดในพื้นที่หนึ่งของโลกส่งผลกระทบต่อศูนย์การสนับสนุนของเรา บุคลากรในสำนักงานอื่นๆ จะได้รับการแจ้งเตือนและครอบคลุมถึงการเปลี่ยนแปลงที่สำนักงานที่ได้รับผลกระทบจัดการตามปกติ สำหรับบริการทางธุรกิจอื่นๆ เช่น การขาย พนักงานจะกระจายตัวไปทั่วโลก ทุกทีมที่ Apigee พร้อมทำงานจากระยะไกลได้หากจำเป็น เครื่องมือที่ใช้ใน Apigee เป็นระบบคลาวด์และเหมาะกับแผนรับมือโรคระบาดอย่างเป็นธรรมชาติ

การอัปเดต

Apigee คือการตรวจสอบและอัปเดตแผน BCP/DR ของเราอย่างน้อยปีละครั้ง ระบบจะใช้ข้อมูลที่รวบรวมจากเหตุการณ์ การเปลี่ยนแปลงผลิตภัณฑ์ มาตรฐานอุตสาหกรรม กิจกรรมการวิเคราะห์ความเสี่ยง และการทดสอบ BCP/DB เพื่ออัปเดตแผน

การวิเคราะห์ผลกระทบทางธุรกิจและการประเมินความเสี่ยง

Google ดำเนินการวิเคราะห์ผลกระทบทางธุรกิจและประเมินความเสี่ยงทุกปี ผลลัพธ์ของ BIA และ RA จะได้รับการจัดลำดับความสำคัญและบันทึกไว้ในระบบติดตามปัญหา