Planificación de la continuidad del negocio y recuperación ante desastres

Estás consultando la documentación de Apigee Edge.
Consulta la documentación de Apigee X.
Información

Apigee es una plataforma multiusuario, de autoservicio y basada en la nube que se ejecuta con una configuración completamente redundante (en vivo/en vivo) en varios centros de datos en varias regiones del mundo. Apigee usa Google Cloud Platform (GCP) y Amazon Web Services (AWS) para nuestra plataforma basada en la nube. Como parte de los servicios que creamos en GCP y AWS, usamos varios centros de datos dentro de cada región y proporcionamos tráfico en vivo a nuestros clientes en estos diversos centros de datos. No tenemos un centro de datos “activo” ni un centro de datos “en espera” (o “secundario” o de “conmutación por error”). Contamos con dos (o más) centros de datos constantemente y, en simultáneo, para prestar servicio al tráfico de los clientes en cada región del mundo.

Plan de BCP/DR

La planificación de continuidad empresarial y la recuperación ante desastres de Apigee (BCP/DR) es un plan para toda la plataforma y no contiene tareas detalladas para clientes individuales. En cambio, la plataforma está configurada para procesar las solicitudes de datos del cliente sin importar las interrupciones. Los datos seguirán fluyendo, incluso si todo el centro de datos está sin conexión. Si toda una región se quedara sin conexión, un cliente de una sola región podría experimentar una interrupción de los servicios de procesamiento de la API. Para los clientes que buscan más que servicios redundantes “dentro de la región”, Apigee ofrece un nivel redundante a nivel global de centros de datos redundantes en los que el tráfico se puede entregar en varias regiones o países para que, si toda una región se queda sin conexión, los datos sigan fluyendo.

Los servicios al cliente de una sola región no se transfieren automáticamente a otra debido a posibles restricciones geográficas en el procesamiento y el acceso de los datos. Apigee aloja servicios para clientes en la región que identifica el cliente. Debido a que puede haber reglamentaciones específicas o compromisos de clientes con sus usuarios en las ubicaciones geográficas de los datos, Apigee no moverá automáticamente los servicios a una región alternativa, ya que esto podría comprometer los compromisos de Apigee con sus clientes o los de Apigee con sus clientes.

Apigee no comparte todo el plan de BCP/DR con ningún cliente individual, ya que contiene información sensible interna de Apigee y referencias a nuestros clientes. Nuestra política de privacidad impide compartir el plan BCP/DR de la plataforma con clientes individuales que podrían exponer otros nombres de clientes. Ofrecemos el mismo nivel de privacidad a cada cliente.

Administración de BCP/DR

El equipo de Seguridad de la Información de Apigee es responsable de supervisar el programa de resiliencia empresarial, mientras que un responsable de la gestión de incidentes rotativo es responsable de la administración y resolución de todos los incidentes. El comandante de incidentes tiene personal de operaciones y de ingeniería disponible en todo momento, junto con guías para todas las acciones que se deban realizar.

Pruebas de BCP/DR

Apigee lleva a cabo procesos operativos que admiten las pruebas de BCP/DR de la plataforma con una frecuencia más frecuente que nuestras pruebas de mesa de BCP/DR anuales completas. Cada mes, Apigee realiza cambios de carga desde nuestro entorno en vivo mientras actualizamos los sistemas que ejecutan el servicio. Este proceso implica eliminar los sistemas del centro de datos completo mientras el centro de datos de intercambio de tráfico maneja la carga. Durante este proceso, después de que se realizan las actualizaciones, se vuelve a activar el primer centro de datos y los servicios se vuelven a ejecutar en vivo para verificar que no se hayan producido problemas. Luego, el centro de datos de intercambio de tráfico se cierra para las mismas actualizaciones y, luego, vuelve a estar en línea. Apigee usa herramientas y técnicas para drenar el tráfico y enviar un pequeño porcentaje de tráfico a los servicios actualizados recientemente a fin de verificar si hay problemas o errores antes de volver al procesamiento de carga completa.

Este proceso operativo coherente supera las “pruebas” de resiliencia semestrales estándar de la industria de nuestro servicio, ya que se convierte en una tarea operativa que ocurre con más frecuencia.

Además de los procesos operativos descritos anteriormente, Apigee también realiza ejercicios de BCP/DR de mesa al menos una vez al año, en los que los miembros del equipo de ingeniería y operaciones se reúnen con otras unidades de negocios de Apigee para simular y analizar de forma lógica los problemas, las respuestas y el impacto de las decisiones que se toman en una situación de desastre simulada. Esto proporciona capacitación y experiencia adicionales a nuestro personal en relación con los planes de BCP/DR más amplios para la empresa en general, además del servicio en sí.

Las pruebas de BCP/DR que realiza Apigee no usan “ejercicios de conmutación por error” ni “ubicaciones secundarias” porque todo eso está integrado en el sistema en ejecución.

Apigee mantiene guías para que las usen todos los equipos operativos y de ingeniería. Estas guías se revisan y actualizan al menos una vez al año y se usan en todos nuestros ejercicios de entrenamiento y pruebas de BCP/DR.

Apigee no comparte informes de pruebas de BCP/DR con clientes individuales, ya que estas pruebas se realizan a nivel de la plataforma, no del cliente. Compartimos los resultados de las tareas operativas y los informes de pruebas de ejercicio anuales con nuestros auditores externos, y estos conforman la base para que el auditor revise nuestro cumplimiento de las normas PCI, HIPAA, contractuales y de otro tipo.

Pruebas de BCP/DR de clientes

Se recomienda a los clientes que tengan sus propios planes de DR que incorporen los servicios de Apigee Edge. El cliente puede y debe considerar cómo Apigee puede redireccionar el tráfico según sea necesario para que los clientes mantengan los servicios para los usuarios finales, incluso durante la interrupción del centro de datos del cliente o durante otro desastre. Sin embargo, este nivel de pruebas está fuera del alcance del plan de DR de Apigee. Recomendamos a los clientes que realicen pruebas de BCP/DR en sus propias aplicaciones y que incluyan Apigee Edge en la prueba.

RTO/RPO

Apigee no tiene objetivos de punto y tiempo de recuperación (RPO/RTO) para nuestros clientes ni en nuestros contratos relacionados con actividades de BCP/DR. Nuestros ANS son el equivalente en la nube de los datos de RTO/RPO. Debido a que Apigee es un servicio redundante basado en la nube, tanto los servicios de administración como los del entorno de ejecución se diseñaron con servicios redundantes en vivo, el RTO y el RPO pueden considerarse “en tiempo real”. Los clientes de una sola región reciben un mínimo de servicios redundantes en diferentes centros de datos de la misma región. Los clientes que deseen niveles más altos de redundancia pueden optar por servicios multirregionales.

Plan de pandemia

Apigee incluye un plan de pandemia como parte de nuestro plan y procesos generales de BCP/DR. Debido a que Apigee es un servicio alojado en la nube, no es necesario que las personas administren el centro de datos. Para las operaciones comerciales, como la asistencia, Apigee opera un equipo de asistencia global las 24 horas, todos los días, en varias oficinas y ubicaciones remotas. Si una pandemia en un área del mundo afecta a una de nuestras ubicaciones de asistencia, se alertará al personal de otras oficinas y se cubrirán los turnos que normalmente administra la oficina afectada. En el caso de otros servicios empresariales, como las ventas, el personal se encuentra distribuido en todo el mundo. Todos los equipos de Apigee están equipados para trabajar de forma remota si es necesario. Las herramientas que se usan en Apigee están basadas en la nube y se prestan naturalmente a un plan de respuesta a la pandemia.

Actualizaciones

Apigee revisa y actualiza nuestro plan de BCP/DR al menos una vez al año. La información recopilada de los incidentes, los cambios en los productos, los estándares de la industria, las actividades de análisis de riesgos y las pruebas de BCP/DB se usa para actualizar el plan.

Análisis del impacto comercial y evaluación de riesgos

Google realiza un análisis de impacto empresarial y una evaluación de riesgos cada año. Los resultados del BIA y la RA se priorizan y documentan en el sistema de seguimiento de problemas.