Pianificazione della continuità aziendale e ripristino di emergenza

Stai visualizzando la documentazione di Apigee Edge.
Vai alla documentazione di Apigee X.
informazioni

Apigee è una piattaforma multitenant, self-service e basata su cloud che viene eseguita in una configurazione completamente ridondante (in tempo reale) su più data center in più regioni del mondo. Apigee utilizza la piattaforma Google Cloud (GCP) e Amazon Web Services (AWS) per la nostra piattaforma basata su cloud. Nell'ambito dei servizi che sviluppiamo su Google Cloud e AWS, utilizziamo più data center all'interno di ogni regione e offriamo la gestione del traffico in tempo reale per i nostri clienti in questi vari data center. Non disponiamo di un data center "in tempo reale" né di un data center "in standby" (o "secondario" o "failover"). Abbiamo due (o più) data center costantemente, che gestiscono il traffico dei clienti in ogni regione a livello globale.

Piano BCP/RE

La pianificazione della continuità aziendale e il ripristino di emergenza (BCP/DR) di Apigee è un piano a livello di piattaforma che non contiene attività dettagliate per i singoli clienti. Piuttosto, la piattaforma è configurata per elaborare le richieste di dati dei clienti indipendentemente da interruzioni e interruzioni del servizio. I dati continueranno a essere trasmessi anche se un intero data center è offline. Se un'intera regione dovesse andare offline, un cliente di una singola regione potrebbe subire un'interruzione dei servizi di elaborazione delle API. Per i clienti che cercano altri servizi ridondanti oltre a quelli "nella regione", Apigee offre un livello ridondante a livello globale di data center ridondanti, in cui il traffico può essere servito in più regioni o paesi, in modo che, se un'intera regione risulta offline, i dati continuino a essere trasmessi.

I servizi clienti di un'unica regione non vengono trasferiti automaticamente in un'altra regione a causa di possibili restrizioni geografiche sul trattamento e sull'accesso dei dati. Apigee ospita servizi per i clienti nella regione identificata dal cliente. Poiché potrebbero esistere normative specifiche o impegni dei clienti nei confronti dei propri utenti sulle posizioni geografiche dei dati, Apigee non sposterà automaticamente i servizi in una regione alternativa, poiché ciò potrebbe compromettere l'impegno di Apigee nei confronti dei propri clienti o degli impegni dei clienti Apigee nei confronti dei propri clienti.

Apigee non condivide l'intero piano BCP/DR con nessun singolo cliente, poiché contiene informazioni sensibili interne Apigee e riferimenti ai nostri clienti. Le nostre norme sulla privacy impediscono la condivisione del piano BCP/DR della piattaforma con singoli clienti che potrebbero esporre nomi di altri clienti. Offriamo lo stesso livello di privacy a tutti i clienti.

Gestione BCP/RE

Il team di sicurezza delle informazioni di Apigee è responsabile della supervisione del programma di resilienza aziendale, mentre un Incident Commander a rotazione è responsabile della gestione e della risoluzione di tutti gli incidenti. L'Incident Commander dispone di personale operativo e tecnico sempre disponibile, oltre a guide pratiche per tutte le azioni che potrebbero essere necessarie.

Test BCP/RE

Apigee esegue processi operativi che supportano i test BCP/DR della piattaforma con una frequenza più frequente rispetto ai nostri test annuali BCP/DR completi da tavolo. Ogni mese Apigee esegue oscillazioni di carico dal nostro ambiente live/live mentre eseguiamo aggiornamenti ai sistemi che eseguono il servizio. Questo processo comporta la rimozione di sistemi di un intero data center, mentre il carico viene gestito dal data center peer. Durante questo processo, dopo l'esecuzione di eventuali aggiornamenti, viene ripristinato il primo data center e i servizi vengono eseguiti di nuovo in tempo reale per verificare che non siano stati introdotti problemi. Quindi il data center peer viene arrestato per gli stessi aggiornamenti e poi riportato di nuovo online. Apigee utilizza strumenti e tecniche per svuotare il traffico e inviare una piccola percentuale di traffico ai servizi aggiornati di recente per verificare la presenza di eventuali problemi o errori prima di tornare all'elaborazione del pieno carico.

Questo processo operativo coerente supera i "test" semestrali di resilienza standard del settore del nostro servizio rendendolo un'attività operativa che si verifica con maggiore frequenza.

Oltre ai processi operativi descritti sopra, Apigee esegue almeno una volta all'anno esercizi BCP/DR da tavolo in cui i membri del team operativo e di progettazione vengono riuniti con altre business unit Apigee per simulare e analizzare in modo logico problemi, risposte e l'impatto delle decisioni prese in uno scenario di emergenza fittizio. Ciò fornisce al nostro personale formazione ed esperienza aggiuntivi in merito ai nostri piani BCP/RE più ampi per l'azienda nel suo complesso, oltre al servizio stesso.

I test BCP/DR eseguiti da Apigee non utilizzano "esercizi di failover" o "località secondarie" perché sono tutti integrati nel sistema in esecuzione.

Apigee offre playbook per l'utilizzo da parte di tutti i team operativi e tecnici. Questi playbook vengono esaminati e aggiornati almeno una volta all'anno e utilizzati in tutti i nostri test ed esercizi di addestramento BCP/RE.

Apigee non condivide i report sui test BCP/RE con singoli clienti, perché questi test vengono eseguiti a livello di piattaforma e non a livello di cliente. Condividiamo i risultati delle nostre attività operative e i report annuali sui test di esercizio da tavolo con i nostri revisori di terze parti, che costituiscono la base per la revisione da parte del revisore della nostra conformità ai requisiti PCI, HIPAA, contrattuali e di altro tipo.

Test BCP/RE del cliente

I clienti sono incoraggiati ad avere i propri piani di RE che incorporano i servizi Apigee Edge. Il cliente può e deve considerare come Apigee può reindirizzare il traffico in base alle esigenze dei clienti per mantenere i servizi per gli utenti finali anche durante l'interruzione di un data center del cliente o altro evento di emergenza. Tuttavia, questo livello di test non rientra nell'ambito del piano di RE di Apigee. Invitiamo i clienti a eseguire test BCP/DR sulle proprie applicazioni e a includere Apigee Edge nel test.

RTO/RPO

Apigee non prevede Recovery Point Objective e Recovery Time Objective (RPO/RTO) per i nostri clienti o nei nostri contratti relativi alle attività BCP/DR. I nostri SLA sono l'equivalente cloud dei punti dati RTO/RPO. Poiché Apigee è un servizio ridondante basato su cloud con servizi di gestione e runtime progettati con servizi in tempo reale ridondanti, RTO e RPO possono essere entrambi considerati "in tempo reale". I clienti di un'unica regione ricevono un minimo di servizi ridondanti in data center diversi con la stessa regione. I clienti che desiderano livelli più elevati di ridondanza possono optare per servizi multiregionali.

Piano per la pandemia

Apigee include un piano per la pandemia come parte del nostro piano e dei nostri processi BCP/RE generali. Poiché Apigee è un servizio ospitato nel cloud, non è necessario che i singoli gestiscano il data center. Per operazioni aziendali come l'assistenza, Apigee gestisce un team di assistenza globale disponibile 24 ore su 24, 7 giorni su 7, in più uffici e località remote. Se una pandemia in un'area del mondo colpisce una delle nostre sedi di assistenza, il personale degli altri uffici verrà avvisato e coprirà i turni normalmente gestiti dall'ufficio interessato. Per altri servizi aziendali come le vendite, la forza lavoro è distribuita a livello globale. Tutti i team di Apigee sono in grado di lavorare da remoto, se necessario. Gli strumenti utilizzati all'interno di Apigee sono basati su cloud e si prestano naturalmente a un piano di risposta alla pandemia.

Aggiornamenti

Apigee esamina e aggiorna il nostro piano BCP/DR almeno una volta all'anno. Per aggiornare il piano vengono utilizzate le informazioni raccolte da incidenti, modifiche ai prodotti, standard di settore, attività di analisi del rischio e test BCP/DB.

Analisi dell'impatto aziendale e valutazioni dei rischi

Google esegue annualmente un'analisi dell'impatto aziendale e una valutazione dei rischi. I risultati della VIA e della RA sono definiti in ordine di priorità e documentati nel sistema di monitoraggio dei problemi.