Stai visualizzando la documentazione di Apigee Edge.
Vai alla documentazione di Apigee X. info
Apigee è una piattaforma multi-tenant, self-service e basata su cloud che viene eseguita in una configurazione completamente ridondante (live/live) su più data center in più regioni del mondo. Apigee utilizza Google Cloud (GCP) e Amazon Web Services (AWS) per la nostra piattaforma basata su cloud. Nell'ambito dei servizi che sviluppiamo su Google Cloud e AWS, utilizziamo più data center all'interno di ogni regione e forniamo il servizio di traffico in tempo reale per i nostri clienti su questi data center. Non abbiamo un data center "live" e un data center "standby" (o "secondario" o "failover"). Abbiamo due o più data center che gestiscono costantemente e contemporaneamente il traffico dei clienti in ogni regione a livello mondiale.
Piano di BCP/RE
La pianificazione della continuità aziendale e il ripristino di emergenza (BCP/DR) di Apigee è un piano a livello di piattaforma e non contiene attività dettagliate per i singoli clienti. La piattaforma è invece configurata per elaborare le richieste di dati dei clienti indipendentemente da interruzioni e guasti. I dati continueranno a essere inviati anche se un intero data center è offline. Se un'intera regione dovesse andare offline, un cliente con sede in una sola regione potrebbe riscontrare un'interruzione dei servizi di elaborazione delle API. Per i clienti che cercano più di servizi ridondanti "in-region", Apigee offre un livello di data center ridondanti a livello globale in cui il traffico può essere gestito in più regioni o paesi, in modo che se un'intera regione diventa offline, i dati continuino a fluire.
I servizi per i clienti di una singola regione non vengono trasferiti automaticamente in un'altra regione a causa di possibili limitazioni geografiche all'accesso e all'elaborazione dei dati. Apigee ospita i servizi per i clienti nella regione identificata dal cliente. Poiché potrebbero esserci normative specifiche o impegni dei clienti nei confronti dei propri utenti in merito alle posizioni geografiche dei dati, Apigee non sposterà automaticamente i servizi in un'altra regione, in quanto ciò potrebbe potenzialmente compromettere gli impegni di Apigee nei confronti dei propri clienti o degli impegni dei clienti di Apigee nei confronti dei propri clienti.
Apigee non condivide il piano completo di BCP/RP con nessun singolo cliente, in quanto contiene informazioni sensibili interne di Apigee e riferimenti ai nostri clienti. Le nostre norme sulla privacy impediscono di condividere il piano BCP/RP della piattaforma con singoli clienti che potrebbero potenzialmente esporre i nomi di altri clienti. Offriamo lo stesso livello di privacy a ogni cliente.
Gestione di BCP/DR
Il team di sicurezza delle informazioni di Apigee è responsabile della supervisione del programma di resilienza aziendale, mentre un Incident Commander di rotazione è responsabile della gestione e della risoluzione di tutti gli incidenti. Il comandante dell'incidente ha sempre a disposizione personale operativo e tecnico, nonché playbook per tutte le azioni che potrebbero essere necessarie.
Test BCP/RE
Apigee esegue processi operativi che supportano i test BCP/DR della piattaforma con una frequenza superiore rispetto ai nostri test di simulazione BCP/DR annuali completi. Ogni mese Apigee esegue oscillazioni di carico dal nostro ambiente di produzione/live mentre aggiorna i sistemi che eseguono il servizio. Questo processo prevede l'interruzione di un intero data center, mentre il carico viene gestito dal data center peer. Durante questa procedura, dopo l'esecuzione di eventuali aggiornamenti, il primo data center viene riavviato e i servizi vengono eseguiti di nuovo per verificare che non siano stati introdotti problemi. Il data center peer viene quindi arrestato per gli stessi aggiornamenti e poi nuovamente messo in linea. Apigee utilizza strumenti e tecniche per drenare il traffico e inviare una piccola percentuale di traffico ai servizi aggiornati di recente per verificare la presenza di problemi o errori prima di tornare all'elaborazione a pieno carico.
Questa procedura operativa coerente supera i "test" di resilienza semestrali standard del settore del nostro servizio rendendolo un'attività operativa che si verifica più di frequente.
Oltre alle procedure operative descritte sopra, Apigee esegue anche esercitazioni di BCP/RP simulate almeno una volta all'anno, in cui i membri del team di ingegneria e operazioni vengono riuniti con altri reparti aziendali di Apigee per simulare e analizzare in modo logico i problemi, le risposte e l'impatto delle decisioni prese in uno scenario di simulazione di disastro. Oltre al servizio stesso, questo offre formazione ed esperienza aggiuntive al nostro personale sui nostri piani BCP/DR più ampi per l'azienda nel suo complesso.
I test BCP/DR eseguiti da Apigee non utilizzano "esercizi di failover" o "località secondarie" perché tutto questo è integrato nel sistema in esecuzione.
Apigee gestisce i playbook per l'utilizzo da parte di tutti i team operativi e tecnici. Questi playbook vengono esaminati e aggiornati almeno una volta all'anno e utilizzati in tutti i nostri test e esercitazioni di formazione BCP/RP.
Apigee non condivide i report dei test BCP/DR con i singoli clienti, perché questi test vengono eseguiti a livello di piattaforma, non a livello di cliente. Condividiamo i risultati delle nostre attività operative e i report annuali degli esercizi di simulazione con i nostri revisori di terze parti, che costituiscono la base per la verifica della nostra conformità ai requisiti PCI, HIPAA, contrattuali e di altro tipo da parte del revisore.
Test BCP/RE del cliente
I clienti sono invitati a includere i servizi Apigee Edge nei propri piani di DR. Il cliente può e deve valutare in che modo Apigee può reindirizzare il traffico in base alle esigenze per mantenere i servizi per gli utenti finali anche durante un'interruzione del data center del cliente o un altro evento catastrofico. Tuttavia, questo livello di test non rientra nell'ambito del piano di RP di Apigee. Invitiamo i clienti a eseguire test di BCP/RP sulle proprie applicazioni e a includere Apigee Edge nel test.
RTO/RPO
Apigee non ha obiettivi di punto di ripristino e tempo di ripristino (RPO/RTO) per i propri clienti o nei propri contratti relativi alle attività di BCP/RP. I nostri SLA sono l'equivalente cloud dei punti dati RTO/RPO. Poiché Apigee è un servizio basato su cloud ridondante, con servizi di gestione e di runtime progettati con servizi in produzione ridondanti, sia RTO che RPO possono essere considerati "in tempo reale". I clienti di una singola regione ricevono un minimo di servizi ridondanti in diversi datacenter della stessa regione. I clienti che richiedono livelli di ridondanza più elevati possono optare per i servizi multiregione.
Piano per le pandemie
Apigee include un piano per le pandemie nell'ambito dei nostri processi e piani generali di BCP/RP. Poiché Apigee è un servizio ospitato sul cloud, non è necessario che le persone gestiscano il data center. Per le operazioni aziendali come l'assistenza, Apigee gestisce un team di assistenza globale 24 ore su 24, 7 giorni su 7 in più sedi e località remote. Se una pandemia in una parte del mondo interessa una delle nostre sedi di assistenza, il personale di altri uffici verrà avvisato e coprirà i turni normalmente gestiti dall'ufficio interessato. Per altri servizi aziendali, come le vendite, la forza lavoro è distribuita a livello globale. Tutti i team di Apigee sono attrezzati per lavorare da remoto, se necessario. Gli strumenti utilizzati in Apigee sono basati su cloud e si prestano naturalmente a un piano di risposta alla pandemia.
Aggiornamenti
Apigee rivede e aggiorna il piano BCP/DR almeno una volta all'anno. Le informazioni raccolte da incidenti, modifiche ai prodotti, standard di settore, attività di analisi del rischio e test BCP/DB vengono utilizzate per aggiornare il piano.
Analisi dell'impatto aziendale e valutazioni dei rischi
Google esegue un'analisi dell'impatto aziendale e una valutazione del rischio ogni anno. I risultati dell'analisi di impatto e dell'analisi di rischio vengono assegnati una priorità e documentati nel sistema di monitoraggio dei problemi.