Lập kế hoạch duy trì hoạt động kinh doanh và phục hồi sau thảm hoạ

Bạn đang xem tài liệu về Apigee Edge.
Chuyển đến tài liệu về Apigee X.
thông tin

Apigee là một nền tảng đa người dùng, tự phục vụ, dựa trên đám mây, chạy ở cấu hình dự phòng đầy đủ (trực tiếp/trực tiếp) trên nhiều trung tâm dữ liệu ở nhiều khu vực trên toàn cầu. Apigee sử dụng Google Cloud Platform (GCP) và Amazon Web Services (AWS) cho nền tảng dựa trên đám mây của chúng tôi. Trong các dịch vụ mà chúng tôi xây dựng trên GCP và AWS, chúng tôi sử dụng nhiều trung tâm dữ liệu trong mỗi khu vực và phân phát lưu lượng truy cập trực tiếp cho khách hàng trên nhiều trung tâm dữ liệu này. Chúng tôi không có trung tâm dữ liệu "trực tiếp" và trung tâm dữ liệu "dự phòng" (hoặc "phụ" hoặc "chuyển đổi dự phòng"). Chúng tôi có hai (hoặc nhiều hơn) trung tâm dữ liệu liên tục và đồng thời phục vụ lưu lượng truy cập của khách hàng ở mỗi khu vực trên toàn cầu.

Kế hoạch BCP/DR

Kế hoạch liên tục kinh doanh và khôi phục thảm họa (BCP/DR) của Apigee là một kế hoạch trên toàn nền tảng và không chứa các nhiệm vụ chi tiết cho từng khách hàng. Thay vào đó, nền tảng này được định cấu hình để xử lý các yêu cầu về dữ liệu khách hàng bất kể sự cố và thời gian ngừng hoạt động. Dữ liệu sẽ tiếp tục chảy ngay cả khi toàn bộ trung tâm dữ liệu không có mạng. Nếu toàn bộ một khu vực bị ngắt kết nối, thì một khách hàng ở một khu vực có thể bị gián đoạn dịch vụ xử lý API. Đối với những khách hàng tìm kiếm nhiều dịch vụ dự phòng hơn "trong khu vực", Apigee cung cấp một cấp độ dự phòng trên toàn cầu của các trung tâm dữ liệu dự phòng, nơi lưu lượng truy cập có thể được phục vụ ở nhiều khu vực hoặc quốc gia để nếu toàn bộ khu vực bị ngắt kết nối, dữ liệu vẫn sẽ được truyền.

Dịch vụ khách hàng tại một khu vực không tự động được chuyển sang khu vực khác do có thể có các quy định hạn chế về địa lý đối với việc xử lý và truy cập dữ liệu. Apigee lưu trữ dịch vụ cho các khách hàng ở khu vực do khách hàng xác định. Vì có thể có các quy định cụ thể hoặc cam kết của khách hàng với người dùng về vị trí địa lý của dữ liệu, nên Apigee sẽ không tự động di chuyển dịch vụ sang một khu vực thay thế, vì điều này có thể làm ảnh hưởng đến cam kết của Apigee với khách hàng hoặc cam kết của khách hàng của Apigee với khách hàng của họ.

Apigee không chia sẻ toàn bộ kế hoạch BCP/DR với bất kỳ khách hàng cá nhân nào vì kế hoạch này chứa thông tin nhạy cảm nội bộ của Apigee và thông tin tham chiếu đến khách hàng của chúng tôi. Chính sách quyền riêng tư của chúng tôi ngăn việc chia sẻ kế hoạch BCP/DR của nền tảng với từng khách hàng có thể làm lộ tên của các khách hàng khác. Chúng tôi cung cấp cùng một mức độ bảo vệ quyền riêng tư cho mỗi khách hàng.

Quản lý BCP/DR

Nhóm Bảo mật thông tin của Apigee chịu trách nhiệm giám sát chương trình Khả năng phục hồi của doanh nghiệp, trong khi một Chỉ huy sự cố luân phiên chịu trách nhiệm quản lý và giải quyết tất cả sự cố. Chỉ huy sự cố luôn có nhân viên vận hành và kỹ thuật viên trực điện thoại, cùng với các sách hướng dẫn cho mọi hành động có thể cần thực hiện.

Kiểm thử BCP/DR

Apigee thực hiện các quy trình vận hành hỗ trợ kiểm thử BCP/DR của nền tảng theo tần suất thường xuyên hơn so với quy trình kiểm thử BCP/DR toàn diện hằng năm. Mỗi tháng, Apigee thực hiện các đợt tăng tải từ môi trường trực tiếp/trực tiếp trong khi chúng tôi cập nhật các hệ thống đang chạy dịch vụ. Quá trình này liên quan đến việc gỡ bỏ toàn bộ hệ thống của một trung tâm dữ liệu trong khi tải được xử lý bởi trung tâm dữ liệu ngang hàng. Trong quá trình này, sau khi thực hiện mọi bản cập nhật, trung tâm dữ liệu đầu tiên sẽ được khôi phục và các dịch vụ sẽ chạy trực tiếp/trực tiếp lại để xác minh rằng không có vấn đề nào xảy ra. Sau đó, trung tâm dữ liệu ngang hàng sẽ bị ngừng hoạt động để cập nhật và sau đó được đưa trở lại mạng. Apigee sử dụng các công cụ và kỹ thuật để loại bỏ lưu lượng truy cập và gửi một tỷ lệ nhỏ lưu lượng truy cập đến các dịch vụ mới cập nhật để kiểm tra xem có vấn đề hoặc lỗi nào không trước khi quay lại xử lý tải đầy đủ.

Quy trình vận hành nhất quán này vượt qua "quy trình kiểm thử" khả năng phục hồi hai năm một lần theo tiêu chuẩn ngành của dịch vụ bằng cách biến quy trình này thành một nhiệm vụ vận hành diễn ra thường xuyên hơn.

Ngoài các quy trình vận hành được mô tả ở trên, Apigee cũng tiến hành các bài tập BCP/DR trên bàn ít nhất một lần mỗi năm, trong đó các thành viên trong nhóm kỹ thuật và vận hành được tập hợp với các đơn vị kinh doanh khác của Apigee để mô phỏng và tìm hiểu các vấn đề, phản hồi cũng như tác động của các quyết định được đưa ra trong một tình huống giả định về thảm họa. Điều này cung cấp thêm đào tạo và kinh nghiệm cho nhân viên của chúng tôi về các kế hoạch BCP/DR lớn hơn cho toàn bộ doanh nghiệp, ngoài chính dịch vụ này.

Quy trình kiểm thử BCP/DR do Apigee thực hiện không sử dụng "bài tập dự phòng" hoặc "vị trí phụ" vì tất cả những điều đó đều được tích hợp vào hệ thống đang chạy.

Apigee duy trì Sách chơi để tất cả các nhóm vận hành và kỹ thuật sử dụng. Các sách hướng dẫn này được xem xét và cập nhật ít nhất một năm một lần, đồng thời được sử dụng trong tất cả các bài kiểm thử và bài tập đào tạo về BCP/DR.

Apigee không chia sẻ báo cáo kiểm thử BCP/DR với từng khách hàng, vì các kiểm thử này được thực hiện ở cấp nền tảng chứ không phải cấp khách hàng. Chúng tôi chia sẻ kết quả của các nhiệm vụ vận hành và báo cáo kiểm thử thực hành trên máy tính hằng năm với các kiểm toán viên bên thứ ba. Đây là cơ sở để kiểm toán viên xem xét mức độ tuân thủ của chúng tôi đối với PCI, HIPAA, các yêu cầu theo hợp đồng và các yêu cầu khác.

Kiểm thử BCP/DR của khách hàng

Khách hàng nên có kế hoạch DR riêng kết hợp với các dịch vụ Apigee Edge. Khách hàng có thể và nên cân nhắc cách Apigee có thể chuyển hướng lưu lượng truy cập khi cần để khách hàng duy trì các dịch vụ cho người dùng cuối ngay cả trong trường hợp trung tâm dữ liệu của khách hàng bị ngừng hoạt động hoặc sự kiện thảm hoạ khác. Tuy nhiên, cấp độ kiểm thử này nằm ngoài phạm vi của kế hoạch DR của Apigee. Khách hàng nên thực hiện kiểm thử BCP/DR trên các ứng dụng của riêng họ và đưa Apigee Edge vào quy trình kiểm thử.

RTO/RPO

Apigee không có mục tiêu về thời gian khôi phục và điểm khôi phục (RPO/RTO) cho khách hàng hoặc trong các hợp đồng liên quan đến hoạt động BCP/DR. Thoả thuận mức độ cung cấp dịch vụ (SLA) của chúng tôi tương đương với các điểm dữ liệu RTO/RPO trên đám mây. Vì Apigee là một dịch vụ dự phòng dựa trên đám mây, trong đó cả dịch vụ quản lý và thời gian chạy đều được thiết kế với các dịch vụ trực tiếp dự phòng, nên cả RTO và RPO đều có thể được xem là "thời gian thực". Khách hàng ở một khu vực sẽ nhận được tối thiểu các dịch vụ dự phòng trong nhiều trung tâm dữ liệu thuộc cùng một khu vực. Những khách hàng muốn có mức độ dự phòng cao hơn có thể chọn sử dụng dịch vụ trên nhiều khu vực.

Kế hoạch ứng phó đại dịch

Apigee đưa kế hoạch ứng phó với đại dịch vào kế hoạch và quy trình tổng thể về BCP/DR. Vì Apigee là một dịch vụ được lưu trữ trên đám mây nên không có yêu cầu nào đối với cá nhân để quản lý trung tâm dữ liệu. Đối với các hoạt động kinh doanh như hỗ trợ, Apigee vận hành một nhóm hỗ trợ toàn cầu 24/7 tại nhiều văn phòng và vị trí từ xa. Nếu một đại dịch ở một khu vực trên thế giới ảnh hưởng đến một trong các vị trí hỗ trợ của chúng tôi, thì nhân viên ở các văn phòng khác sẽ được thông báo và đảm nhận các ca làm việc mà văn phòng chịu ảnh hưởng thường xử lý. Đối với các dịch vụ kinh doanh khác như bán hàng, lực lượng lao động được phân bổ trên toàn cầu. Tất cả các nhóm tại Apigee đều được trang bị để làm việc từ xa nếu cần. Các công cụ được sử dụng trong Apigee đều dựa trên đám mây và phù hợp với kế hoạch ứng phó với đại dịch.

Nội dung cập nhật

Apigee xem xét và cập nhật kế hoạch BCP/DR ít nhất một lần mỗi năm. Thông tin thu thập được từ các sự cố, thay đổi về sản phẩm, tiêu chuẩn ngành, hoạt động phân tích rủi ro và kiểm thử BCP/DB được dùng để cập nhật kế hoạch.

Phân tích tác động đối với hoạt động kinh doanh và đánh giá rủi ro

Google tiến hành phân tích tác động đến hoạt động kinh doanh và đánh giá rủi ro hằng năm. Kết quả của BIA và RA được ưu tiên và ghi lại trong hệ thống theo dõi lỗi.