Lập kế hoạch duy trì hoạt động kinh doanh và phục hồi sau thảm hoạ

Bạn đang xem tài liệu về Apigee Edge.
Chuyển đến tài liệu về Apigee X.
thông tin

Apigee là một nền tảng dựa trên đám mây, tự phục vụ, đa khách hàng, chạy trong cấu hình hoàn toàn dự phòng (trực tiếp/trực tiếp) trên nhiều trung tâm dữ liệu ở nhiều khu vực trên toàn cầu. Apigee sử dụng Google Cloud Platform (GCP) và Amazon Web Services (AWS) cho nền tảng trên đám mây của chúng tôi. Trong các dịch vụ chúng tôi xây dựng trên GCP và AWS, chúng tôi sử dụng nhiều trung tâm dữ liệu ở từng khu vực và lưu lượng truy cập trực tiếp của dịch vụ cho khách hàng trên nhiều trung tâm dữ liệu này. Chúng tôi không có trung tâm dữ liệu "đang hoạt động" và trung tâm dữ liệu "dự phòng" (hoặc "phụ" hoặc "chuyển đổi dự phòng"). Chúng tôi có hai (hoặc nhiều) trung tâm dữ liệu liên tục phục vụ đồng thời lưu lượng truy cập của khách hàng ở mỗi khu vực trên toàn cầu.

Kế hoạch BCP/DR

Tính năng Lập kế hoạch duy trì hoạt động kinh doanh liên tục và phục hồi sau thảm hoạ (BCP/DR) của Apigee là một kế hoạch được áp dụng trên toàn nền tảng và không có công việc chi tiết cho từng khách hàng. Thay vào đó, nền tảng này được định cấu hình để xử lý các yêu cầu về dữ liệu khách hàng bất kể tình trạng gián đoạn và ngừng dịch vụ. Dữ liệu sẽ tiếp tục lưu chuyển ngay cả khi toàn bộ trung tâm dữ liệu không có kết nối mạng. Nếu toàn bộ một khu vực bị ngắt kết nối, thì khách hàng ở một khu vực duy nhất có thể gặp phải tình trạng dịch vụ xử lý API ngừng hoạt động. Đối với những khách hàng đang tìm kiếm nhiều dịch vụ dự phòng hơn "trong khu vực", Apigee cung cấp các trung tâm dữ liệu dự phòng có mức độ dư thừa trên toàn cầu. Nhờ vậy, lưu lượng truy cập có thể được phục vụ ở nhiều khu vực hoặc quốc gia để nếu toàn bộ khu vực không có kết nối mạng thì dữ liệu vẫn được lưu chuyển.

Các dịch vụ khách hàng chỉ áp dụng cho một khu vực sẽ không tự động được chuyển sang một khu vực khác do có thể có những quy định hạn chế về địa lý đối với việc xử lý và truy cập dữ liệu. Apigee tổ chức các dịch vụ cho khách hàng ở khu vực mà khách hàng này xác định. Do có thể có quy định cụ thể hoặc cam kết của khách hàng đối với người dùng về vị trí địa lý của dữ liệu, nên Apigee sẽ không tự động chuyển dịch vụ sang khu vực khác, vì điều này có thể ảnh hưởng đến cam kết của Apigee đối với khách hàng hoặc cam kết của khách hàng của Apigee đối với khách hàng.

Apigee không chia sẻ kế hoạch BCP/DR đầy đủ với bất kỳ khách hàng cá nhân nào, vì gói này có chứa thông tin nhạy cảm nội bộ và đề cập đến khách hàng của Apigee. Chính sách quyền riêng tư của chúng tôi ngăn chặn việc chia sẻ gói BCP/DR của nền tảng với từng khách hàng, vì điều này có khả năng tiết lộ tên khách hàng của người khác. Chúng tôi cung cấp cùng một mức độ bảo mật này cho mỗi khách hàng.

Quản lý BCP/DR

Nhóm Bảo mật thông tin Apigee chịu trách nhiệm giám sát chương trình Khả năng phục hồi kinh doanh, còn một Chỉ huy sự cố luân phiên sẽ chịu trách nhiệm quản lý và giải quyết mọi sự cố. Chỉ huy sự cố luôn có nhân viên vận hành và kỹ thuật trực điện thoại cùng với cẩm nang về mọi hành động có thể cần thực hiện.

Kiểm thử BCP/DR

Apigee thực hiện các quy trình vận hành hỗ trợ việc kiểm thử BCP/DR cho nền tảng này với tần suất thường xuyên hơn so với quy trình kiểm thử BCP/DR đầy đủ hằng năm của chúng tôi. Mỗi tháng, Apigee thực hiện các thay đổi về tải trong môi trường trực tiếp/trực tiếp trong khi chúng tôi cập nhật các hệ thống đang chạy dịch vụ này. Quá trình này bao gồm việc gỡ bỏ toàn bộ hệ thống của một trung tâm dữ liệu trong khi trung tâm dữ liệu ngang hàng xử lý việc tải dữ liệu. Trong quá trình này, sau khi thực hiện bất kỳ bản cập nhật nào, trung tâm dữ liệu đầu tiên sẽ được sao lưu và các dịch vụ sẽ chạy trở lại/hoạt động để xác minh rằng không có vấn đề nào xảy ra. Sau đó, trung tâm dữ liệu ngang hàng được đưa xuống để tiếp nhận thông tin cập nhật tương tự rồi đưa trở lại trên mạng. Apigee dùng các công cụ và kỹ thuật để giảm lưu lượng truy cập và gửi một tỷ lệ nhỏ lưu lượng truy cập đến các dịch vụ mới cập nhật để kiểm tra xem có vấn đề hoặc lỗi nào không trước khi quay lại quá trình xử lý tải đầy đủ.

Quy trình vận hành nhất quán này vượt quá tiêu chuẩn của ngành "kiểm tra" khả năng phục hồi hai năm một lần theo tiêu chuẩn của ngành đối với dịch vụ của chúng tôi bằng cách biến dịch vụ này thành một nhiệm vụ vận hành xảy ra thường xuyên hơn.

Ngoài các quy trình vận hành như mô tả ở trên, Apigee còn tiến hành các bài tập BCP/DR tại bàn ít nhất một lần mỗi năm. Trong đó, các thành viên trong nhóm kỹ thuật và vận hành sẽ cùng với các đơn vị kinh doanh khác của Apigee mô phỏng và xem xét các vấn đề, phản hồi cũng như tác động của các quyết định được đưa ra trong tình huống mô phỏng thảm hoạ một cách hợp lý. Việc này giúp nhân viên của chúng tôi có thêm chương trình đào tạo và kinh nghiệm về các gói BCP/DR lớn hơn dành cho toàn bộ doanh nghiệp, bên cạnh việc cung cấp dịch vụ.

Hoạt động kiểm thử BCP/DR do Apigee thực hiện không sử dụng "bài tập chuyển đổi dự phòng" hay "vị trí phụ" vì tất cả những dữ liệu này đã được tích hợp vào hệ thống đang chạy.

Apigee luôn duy trì Play Sách cho tất cả các nhóm vận hành và kỹ thuật sử dụng. Những cẩm nang này được xem xét và cập nhật ít nhất là hằng năm và được dùng trong tất cả các bài tập huấn luyện và kiểm thử BCP/DR của chúng tôi.

Apigee không chia sẻ báo cáo thử nghiệm BCP/DR với từng khách hàng vì những thử nghiệm này được thực hiện ở cấp nền tảng, chứ không phải ở cấp khách hàng. Chúng tôi chia sẻ kết quả nhiệm vụ vận hành và báo cáo kiểm tra bài tập thể dục hằng năm trên mặt bàn với kiểm tra viên bên thứ ba. Những kết quả này chính là cơ sở để kiểm toán viên đánh giá tình trạng tuân thủ của chúng tôi đối với PCI, HIPAA, hợp đồng và các yêu cầu khác.

Thử nghiệm BCP/DR của khách hàng

Khách hàng nên sở hữu gói DR của riêng mình và có tích hợp với các dịch vụ Apigee Edge. Khách hàng có thể và nên cân nhắc cách Apigee có thể chuyển hướng lưu lượng truy cập (nếu cần) cho khách hàng nhằm duy trì dịch vụ cho người dùng cuối ngay cả trong thời gian trung tâm dữ liệu khách hàng ngừng hoạt động hoặc xảy ra thảm hoạ khác. Tuy nhiên, cấp độ thử nghiệm này nằm ngoài phạm vi của gói Apigee. Khách hàng nên tiến hành kiểm thử BCP/DR trên các ứng dụng của mình, đồng thời đề cập đến Apigee Edge trong thử nghiệm.

RTO/RPO

Apigee không có mục tiêu về thời điểm phục hồi và thời gian phục hồi (RPO/RTO) cho khách hàng hoặc trong hợp đồng của chúng tôi liên quan đến các hoạt động liên quan đến BCP/DR. SLA của chúng tôi là nền tảng đám mây tương đương với các điểm dữ liệu RTO/RPO. Vì Apigee là một dịch vụ dự phòng trên đám mây với cả dịch vụ quản lý và thời gian chạy được thiết kế với các dịch vụ trực tiếp dự phòng, nên cả RTO và RPO đều có thể được xem là "theo thời gian thực". Khách hàng ở một khu vực duy nhất sẽ nhận được tối thiểu dịch vụ dự phòng ở các trung tâm dữ liệu khác nhau có cùng khu vực. Những khách hàng muốn mức độ dự phòng cao hơn có thể chọn sử dụng các dịch vụ đa khu vực.

Kế hoạch đại dịch

Apigee đưa ra kế hoạch ứng phó với đại dịch nằm trong kế hoạch và các quy trình tổng thể về BCP/DR của chúng tôi. Vì Apigee là một dịch vụ được lưu trữ trên đám mây, nên không có yêu cầu cá nhân phải quản lý trung tâm dữ liệu. Đối với các hoạt động kinh doanh như hỗ trợ, Apigee có một nhóm hỗ trợ toàn cầu hoạt động 24x7 ở nhiều văn phòng và địa điểm từ xa. Nếu đại dịch ở một khu vực trên thế giới ảnh hưởng đến một trong các địa điểm hỗ trợ của chúng tôi, thì nhân viên ở các văn phòng khác sẽ được cảnh báo và chịu trách nhiệm cho những công việc mà văn phòng bị ảnh hưởng thường xử lý. Đối với các dịch vụ kinh doanh khác như bán hàng, lực lượng lao động được phân bổ trên toàn cầu. Tất cả các nhóm tại Apigee đều được trang bị để làm việc từ xa nếu cần. Các công cụ được sử dụng trong Apigee đều dựa trên đám mây và được ưu tiên sử dụng một cách tự nhiên cho kế hoạch ứng phó với đại dịch.

Các bản cập nhật

Apigee đánh giá và cập nhật kế hoạch BCP/DR ít nhất là mỗi năm. Những thông tin thu thập được từ các sự cố, sự thay đổi về sản phẩm, tiêu chuẩn ngành, các hoạt động phân tích rủi ro và hoạt động thử nghiệm BCP/DB sẽ được dùng để cập nhật kế hoạch.

Phân tích tác động kinh doanh và đánh giá rủi ro

Google tiến hành phân tích tác động đối với hoạt động kinh doanh và đánh giá rủi ro hằng năm. Kết quả của BIA và RA được ưu tiên và ghi lại trong hệ thống theo dõi vấn đề.