Perencanaan Kelangsungan Bisnis dan Pemulihan dari Bencana

Anda sedang melihat dokumentasi Apigee Edge.
Buka dokumentasi Apigee X.
info

Apigee adalah platform multi-tenant, layanan mandiri, dan berbasis cloud yang berjalan dalam konfigurasi redundan penuh (live/live) di beberapa pusat data di beberapa wilayah di seluruh dunia. Apigee menggunakan Google Cloud Platform (GCP) dan Amazon Web Services (AWS) untuk platform berbasis cloud kami. Sebagai bagian dari layanan yang kami buat di GCP dan AWS, kami menggunakan beberapa pusat data dalam setiap region dan melayani traffic live untuk pelanggan kami di beberapa pusat data ini. Kami tidak memiliki pusat data "live" dan pusat data "standby" (atau "sekunder" atau "failover"). Kami memiliki dua (atau lebih) pusat data yang terus-menerus dan secara bersamaan melayani traffic pelanggan di setiap wilayah secara global.

Rencana BCP/DR

Business Continuity Planning dan Disaster Recovery (BCP/DR) Apigee adalah rencana seluruh platform dan tidak berisi tugas mendetail untuk setiap pelanggan. Sebaliknya, platform dikonfigurasi untuk memproses permintaan data pelanggan terlepas dari gangguan dan pemadaman. Data akan terus mengalir meskipun seluruh pusat data offline. Jika seluruh region offline, pelanggan satu region dapat mengalami pemadaman layanan pemrosesan API. Untuk pelanggan yang mencari lebih dari layanan redundan "dalam region", Apigee menawarkan tingkat redundansi pusat data redundan secara global tempat traffic dapat dilayani di beberapa region atau negara sehingga jika seluruh region offline, data masih dapat mengalir.

Layanan pelanggan satu region tidak otomatis ditransfer ke region lain karena kemungkinan pembatasan geografis pada pemrosesan dan akses data. Apigee menghosting layanan untuk pelanggan di wilayah yang diidentifikasi oleh pelanggan. Karena mungkin ada peraturan tertentu atau komitmen pelanggan kepada pengguna mereka terkait lokasi geografis data, Apigee tidak akan otomatis memindahkan layanan ke region alternatif, karena hal ini berpotensi membahayakan komitmen Apigee kepada pelanggannya atau komitmen pelanggan Apigee kepada pelanggan mereka.

Apigee tidak membagikan rencana BCP/DR lengkap kepada setiap pelanggan, karena berisi informasi sensitif internal Apigee dan referensi kepada pelanggan kami. Kebijakan privasi kami mencegah pembagian rencana BCP/DR platform kepada pelanggan perorangan yang berpotensi mengekspos nama pelanggan lainnya. Kami menawarkan tingkat privasi yang sama kepada setiap pelanggan.

Pengelolaan BCP/DR

Tim Keamanan Informasi Apigee bertanggung jawab atas pengawasan program Ketahanan Bisnis, sementara Komandan Insiden yang bergantian bertanggung jawab atas pengelolaan dan penyelesaian semua insiden. Incident Commander memiliki personel operasional dan engineering yang selalu siap siaga bersama dengan playbook untuk semua tindakan yang mungkin perlu dilakukan.

Pengujian BCP/DR

Apigee melakukan proses operasional yang mendukung pengujian BCP/DR platform dengan lebih sering daripada pengujian tabletop BCP/DR tahunan penuh kami. Setiap bulan, Apigee melakukan perubahan beban dari lingkungan aktif/live saat kami melakukan update pada sistem yang menjalankan layanan. Proses ini melibatkan penghentian seluruh sistem di satu pusat data saat beban ditangani oleh pusat data peer. Selama proses ini, setelah update dilakukan, pusat data pertama akan diaktifkan kembali dan layanan akan dijalankan secara live/live lagi untuk memverifikasi bahwa tidak ada masalah yang muncul. Kemudian, data center peer dinonaktifkan untuk update yang sama, lalu diaktifkan kembali. Apigee menggunakan alat dan teknik untuk menghabiskan traffic dan mengirim persentase traffic kecil ke layanan yang baru saja diupdate untuk memeriksa masalah atau error sebelum kembali ke pemrosesan beban penuh.

Proses operasional yang konsisten ini melebihi "pengujian" ketahanan dua tahunan standar industri layanan kami dengan menjadikannya tugas operasional yang terjadi lebih sering.

Selain proses operasional yang dijelaskan di atas, Apigee juga melakukan simulasi BCP/DR setidaknya sekali setahun dengan mengumpulkan anggota tim engineering dan operasi bersama unit bisnis Apigee lainnya untuk menyimulasikan dan membahas masalah, respons, dan dampak keputusan yang dibuat dalam skenario simulasi bencana. Hal ini memberikan pelatihan dan pengalaman tambahan bagi personel kami terkait rencana BCP/DR yang lebih besar untuk perusahaan secara keseluruhan, selain layanan itu sendiri.

Pengujian BCP/DR yang dilakukan oleh Apigee tidak menggunakan "latihan failover" atau "lokasi sekunder" karena semua itu sudah terintegrasi ke dalam sistem yang berjalan.

Apigee mengelola Playbook untuk digunakan oleh semua tim operasional dan engineering. Playbook ini ditinjau dan diperbarui setidaknya setiap tahun dan digunakan dalam semua pengujian BCP/DR dan latihan pelatihan kami.

Apigee tidak membagikan laporan pengujian BCP/DR kepada setiap pelanggan, karena pengujian ini dilakukan di tingkat platform, bukan tingkat pelanggan. Kami membagikan hasil tugas operasional dan laporan pengujian simulasi meja tahunan kepada auditor pihak ketiga kami, dan hal ini menjadi dasar untuk peninjauan auditor atas kepatuhan kami terhadap PCI, HIPAA, kontrak, dan persyaratan lainnya.

Pengujian BCP/DR pelanggan

Pelanggan dianjurkan untuk memiliki rencana DR mereka sendiri yang menggabungkan layanan Apigee Edge. Pelanggan dapat dan harus mempertimbangkan cara Apigee dapat mengalihkan traffic sesuai kebutuhan agar pelanggan dapat mempertahankan layanan pengguna akhir bahkan selama pemadaman data center pelanggan atau peristiwa bencana lainnya. Namun, tingkat pengujian ini berada di luar cakupan rencana DR Apigee. Sebaiknya pelanggan melakukan pengujian BCP/DR pada aplikasi mereka sendiri dan menyertakan Apigee Edge dalam pengujian.

RTO/RPO

Apigee tidak memiliki tujuan titik pemulihan dan waktu pemulihan (RPO/RTO) untuk pelanggan kami atau dalam kontrak kami yang terkait dengan aktivitas BCP/DR. SLA kami setara dengan titik data RTO/RPO di cloud. Karena Apigee adalah layanan berbasis cloud redundan dengan layanan pengelolaan dan runtime yang dirancang dengan layanan live redundan, RTO dan RPO dapat dilihat sebagai 'real-time'. Pelanggan satu region menerima layanan redundan minimum di data center yang berbeda dengan region yang sama. Pelanggan yang menginginkan tingkat redundansi yang lebih tinggi dapat memilih layanan multi-region.

Rencana pandemi

Apigee menyertakan rencana pandemi sebagai bagian dari rencana dan proses BCP/DR secara keseluruhan. Karena Apigee adalah layanan yang dihosting di cloud, tidak ada persyaratan bagi individu untuk mengelola pusat data. Untuk operasi bisnis seperti dukungan, Apigee mengoperasikan tim dukungan global 24x7 di beberapa kantor dan lokasi jarak jauh. Jika pandemi di satu area di dunia memengaruhi salah satu lokasi dukungan kami, personel di kantor lain akan diberi tahu dan mengisi shift yang biasanya ditangani oleh kantor yang terpengaruh. Untuk layanan bisnis lainnya seperti penjualan, tenaga kerja didistribusikan secara global. Semua tim di Apigee dilengkapi untuk bekerja dari jarak jauh jika diperlukan. Alat yang digunakan dalam Apigee berbasis cloud dan cocok untuk rencana respons pandemi.

Pembaruan

Apigee meninjau dan memperbarui rencana BCP/DR kami setidaknya setiap tahun. Informasi yang dikumpulkan dari insiden, perubahan produk, standar industri, aktivitas analisis risiko, dan pengujian BCP/DB digunakan untuk memperbarui rencana.

Analisis Dampak Bisnis dan Penilaian Risiko

Google melakukan analisis dampak bisnis dan Penilaian risiko setiap tahun. Hasil BIA dan RA diprioritaskan dan didokumentasikan dalam sistem pelacakan masalah.