Planification de la continuité des activités et reprise après sinistre

Vous consultez la documentation d'Apigee Edge.
Consultez la documentation Apigee X.
en savoir plus

Apigee est une plate-forme cloud mutualisée et en libre-service qui s'exécute dans une configuration entièrement redondante (live/live) sur plusieurs centres de données, répartis dans plusieurs régions du monde. Apigee utilise Google Cloud Platform (GCP) et Amazon Web Services (AWS) pour notre plate-forme cloud. Dans le cadre des services développés sur GCP et AWS, nous utilisons plusieurs centres de données dans chaque région, et nous assurons le trafic en temps réel pour nos clients dans ces centres de données. Nous ne disposons pas d'un centre de données "en direct" ni d'un centre de données "de secours" (ou "secondaire" ou "basculement"). Nous disposons au moins deux centres de données qui desservent en permanence et simultanément le trafic client dans chaque région du monde.

Plan BCP/DR

La planification de la continuité des activités et la reprise après sinistre (BCP/DR) Apigee est un plan à l'échelle de la plate-forme qui ne contient pas de tâches détaillées pour les clients individuels. La plate-forme est plutôt configurée pour traiter les requêtes de données des clients, quels que soient les perturbations et les pannes. Les données continuent à circuler même si l'ensemble d'un centre de données est hors connexion. En cas de déconnexion d'une région entière, les services de traitement des API risquent d'être interrompus pour un client situé dans une seule région. Pour les clients qui recherchent des services autres que des services redondants "dans la région", Apigee offre un niveau mondial redondant de centres de données redondants, dans lesquels le trafic peut être assuré dans plusieurs régions ou pays. Ainsi, si une région entière devient indisponible, les données continuent de circuler.

Les services client monorégions ne sont pas automatiquement transférés vers une autre région, en raison des restrictions géographiques potentielles concernant le traitement des données et l'accès à celles-ci. Apigee héberge des services pour les clients de la région identifiée par le client. Étant donné que des réglementations spécifiques ou des engagements client peuvent s'appliquer à leurs utilisateurs concernant l'emplacement géographique des données, Apigee ne déplacera pas automatiquement les services vers une autre région. En effet, cela pourrait compromettre les engagements d'Apigee envers ses clients ou ceux des clients Apigee envers leurs clients.

Apigee ne partage le plan BCP/DR complet avec aucun client individuel, car il contient des informations sensibles internes d'Apigee et des références à nos clients. Nos règles de confidentialité empêchent de partager le plan BCP/DR de la plate-forme avec des clients individuels susceptibles de divulguer le nom d'autres clients. Nous offrons ce même niveau de confidentialité à chaque client.

Gestion du BCP/DR

L'équipe Apigee Information Security est responsable de la supervision du programme de résilience de l'entreprise, tandis qu'un commandant en alternance est responsable de la gestion et de la résolution de tous les incidents. Le commandant de l'incident dispose à tout moment du personnel opérationnel et d'ingénierie de garde, ainsi que de guides pour toutes les mesures à prendre.

Tests BCP/DR

Apigee effectue des processus opérationnels qui permettent de réaliser des tests BCP/DR de la plate-forme à une fréquence plus fréquente que nos tests sur table BCP/DR annuels complets. Chaque mois, Apigee effectue des écarts de charge depuis notre environnement réel pendant que nous mettons à jour les systèmes exécutant le service. Ce processus implique la suppression de l'intégralité des systèmes d'un centre de données pendant que la charge est gérée par le centre de données pair. Au cours de ce processus, une fois les mises à jour effectuées, le premier centre de données est rétabli, et les services sont exécutés de nouveau en ligne pour vérifier qu'aucun problème n'a été introduit. Ensuite, le centre de données de pairs est arrêté pour les mêmes mises à jour, puis remis en ligne. Apigee utilise des outils et des techniques pour drainer le trafic et envoyer un petit pourcentage de trafic vers les services récemment mis à jour afin de rechercher d'éventuels problèmes ou erreurs avant de revenir au traitement de charge complète.

Ce processus opérationnel cohérent dépasse le "test" de résilience semestriel standard de notre service en faisant une tâche opérationnelle plus fréquente.

En plus des processus opérationnels décrits ci-dessus, Apigee effectue également au moins une fois par an des exercices de BCP/DR sur table, au cours desquels les membres des équipes d'ingénierie et d'exploitation sont réunis avec d'autres unités commerciales d'Apigee pour simuler et examiner de manière logique les problèmes, les réponses et l'impact des décisions prises dans un scénario de sinistre fictif. Notre personnel bénéficie ainsi d'une formation et d'une expérience supplémentaires concernant nos plans BCP/DR plus importants pour l'entreprise dans son ensemble, en plus du service lui-même.

Les tests BCP/DR effectués par Apigee n'utilisent pas les "exercices de basculement" ni les "emplacements secondaires", car tout cela est intégré au système en cours d'exécution.

Apigee gère des playbooks destinés à toutes les équipes opérationnelles et d'ingénierie. Ces playbooks sont examinés et mis à jour au moins une fois par an, et nous les utilisons dans tous nos tests et exercices de formation concernant la BCP/DR.

Apigee ne partage pas les rapports de test BCP/DR avec des clients individuels, car ces tests sont effectués au niveau de la plate-forme et non au niveau du client. Nous partageons les résultats de nos tâches opérationnelles et les rapports annuels d'exercices sur table avec nos auditeurs tiers. Ces résultats constituent la base de l'examen de notre auditeur concernant notre conformité avec les normes PCI, HIPAA, contractuelles et autres exigences.

Tests BCP/DR au niveau du client

Nous encourageons les clients à disposer de leurs propres plans de reprise après sinistre qui intègrent les services Apigee Edge. Le client peut et doit envisager la manière dont Apigee peut rediriger le trafic si nécessaire pour permettre aux clients de maintenir les services de l'utilisateur final même en cas de panne du centre de données client ou de tout autre sinistre. Toutefois, ce niveau de test n'entre pas dans le cadre du plan de reprise après sinistre Apigee. Nous encourageons les clients à effectuer des tests BCP/DR sur leurs propres applications et à inclure Apigee Edge dans le test.

DMIA/PDMA

Apigee n'offre pas d'objectif de point de récupération et de temps de récupération (RPO/RTO) pour nos clients, ni dans nos contrats liés aux activités BCP/DR. Nos contrats de niveau de service sont l'équivalent cloud des points de données RTO/RPO. Apigee étant un service cloud redondant, dont les services de gestion et d'exécution sont conçus avec des services en direct redondants, le RTO et le RPO peuvent être vus en "temps réel". Les clients à région unique reçoivent un minimum de services redondants dans différents centres de données de la même région. Les clients qui souhaitent bénéficier de niveaux de redondance plus élevés peuvent opter pour des services multirégionaux.

Plan de pandémie

Apigee inclut un plan de pandémie dans le cadre de notre plan et de nos processus BCP/DR globaux. Apigee étant un service hébergé dans le cloud, les utilisateurs n'ont pas besoin de gérer le centre de données. Pour les opérations commerciales telles que l'assistance, Apigee dispose d'une équipe d'assistance mondiale disponible 24 h/24 et 7 j/7, répartie sur plusieurs sites et sites distants. Si une pandémie dans une région du monde a des répercussions sur l'un de nos sites d'assistance, le personnel des autres bureaux en en est averti et prend le relais sur la charge normalement gérée par le bureau concerné. Pour d'autres services professionnels tels que la vente, la main-d'œuvre est répartie dans le monde entier. Toutes les équipes d'Apigee sont équipées pour travailler à distance si nécessaire. Les outils utilisés dans Apigee sont basés sur le cloud, et se prêtent naturellement à un plan de réponse à la pandémie.

Mises à jour

Apigee examine et met à jour son plan BCP/DR au moins une fois par an. Les informations collectées à partir des incidents, des modifications du produit, des normes du secteur, des activités d'analyse des risques et des tests BCP/DB sont utilisées pour mettre à jour le plan.

Analyse d'impact sur l'entreprise et évaluations des risques

Google effectue chaque année une analyse de l'impact sur l'entreprise et une évaluation des risques. Les résultats de la BIA et de l'AR sont hiérarchisés et documentés dans le système de suivi des problèmes.