Geschäftskontinuitätsplanung und Notfallwiederherstellung

Sie sehen die Dokumentation zu Apigee Edge.
Zur Apigee X-Dokumentation
weitere Informationen

Apigee ist eine mehrinstanzenfähige, Self-Service-Cloud-Plattform, die in einer vollständig redundanten (Live-/Live-)Konfiguration über mehrere Rechenzentren in mehreren Regionen der Welt ausgeführt wird. Apigee nutzt die Google Cloud Platform (GCP) und Amazon Web Services (AWS) für unsere cloudbasierte Plattform. Im Rahmen der Dienste, die wir auf der GCP und AWS erstellen, nutzen wir mehrere Rechenzentren in jeder Region und bieten Live-Traffic für unsere Kunden über diese Rechenzentren hinweg an. Wir haben kein „Live“-Rechenzentrum und kein „Stand-by“-Rechenzentrum (oder „sekundäres“ oder „Failover“). Wir betreiben in jeder Region weltweit zwei (oder mehr) Rechenzentren, die ständig und gleichzeitig für den Kundenverkehr zuständig sind.

BCP/DR-Plan

Apigee Business Continuity Planning and Disaster Recovery (BCP/DR) ist ein plattformweiter Plan und enthält keine detaillierten Aufgaben für einzelne Kunden. Die Plattform ist vielmehr so konfiguriert, dass Anfragen zu Kundendaten unabhängig von Unterbrechungen und Ausfällen verarbeitet werden. Die Daten fließen auch dann weiter, wenn ein ganzes Rechenzentrum offline ist. Würde eine ganze Region offline gehen, könnte ein Kunde in einer einzigen Region einen Ausfall der API-Verarbeitungsdienste feststellen. Für Kunden, die mehr als nur „in-regionale“ redundante Dienste suchen, bietet Apigee eine global redundante Ebene von redundanten Rechenzentren, in denen der Traffic in mehreren Regionen oder Ländern bedient werden kann, sodass die Daten auch dann fließen, wenn eine ganze Region offline geht.

Kundendienste aus einer einzelnen Region werden aufgrund möglicher geografischer Einschränkungen bei der Datenverarbeitung und dem Zugriff nicht automatisch in eine andere Region übertragen. Apigee hostet Dienste für Kunden in der vom Kunden angegebenen Region. Da es möglicherweise spezifische Vorschriften oder Kundenverpflichtungen für seine Nutzer in Bezug auf geografische Standorte gibt, verschiebt Apigee Dienste nicht automatisch in eine alternative Region, da dies die Verpflichtungen von Apigee gegenüber seinen Kunden oder die Verpflichtungen von Apigee-Kunden gegenüber ihren Kunden gefährden könnte.

Apigee teilt den vollständigen BCP/DR-Plan nicht mit einzelnen Kunden, da es Apigee-interne vertrauliche Informationen und Verweise auf unsere Kunden enthält. Unsere Datenschutzerklärung verhindert, dass der Plattform-BCP/DR-Plan mit einzelnen Kunden geteilt wird, da dies potenziell andere Kundennamen offenlegen könnte. Wir bieten jedem Kunden den gleichen Datenschutz.

BCP/DR-Verwaltung

Das Apigee Information Security-Team ist für die Aufsicht des Programms zur Robustheit von Unternehmen verantwortlich, während ein rotierendes Incident Commander für die Verwaltung und Lösung aller Vorfälle verantwortlich ist. Für den Incident Commander stehen jederzeit Betriebs- und technisches Personal sowie Playbooks für alle erforderlichen Maßnahmen zur Verfügung.

BCP/DR-Tests

Apigee führt Betriebsprozesse aus, die BCP/DR-Tests der Plattform in einem häufigeren Rhythmus unterstützen als unsere vollständigen jährlichen BCP/DR-Tests auf dem Tisch. Apigee führt jeden Monat Laständerungen von unserer Live-/Live-Umgebung durch, während wir Aktualisierungen an den Systemen vornehmen, auf denen der Dienst ausgeführt wird. Bei diesem Prozess werden die Systeme eines ganzen Rechenzentrums heruntergefahren, während die Last vom Peer-Rechenzentrum verarbeitet wird. Während dieses Vorgangs wird nach Durchführung von Aktualisierungen das erste Rechenzentrum wieder in Betrieb genommen und die Dienste wieder live/live ausgeführt, um sicherzustellen, dass keine Probleme aufgetreten sind. Dann wird das Peer-Rechenzentrum für dieselben Updates heruntergefahren und dann wieder online geschaltet. Apigee verwendet Tools und Verfahren, um den Traffic abzuziehen und einen kleinen Prozentsatz des Traffics an kürzlich aktualisierte Dienste zu senden, um zu prüfen, ob Probleme oder Fehler vorliegen, bevor wieder die vollständige Lastverarbeitung durchgeführt wird.

Dieser konsistente Betriebsprozess überschreitet die branchenüblichen halbjährlichen „Resilienztests“ unseres Dienstes, da er zu einer operativen Aufgabe wird, die häufiger auftritt.

Zusätzlich zu den oben beschriebenen Betriebsprozessen führt Apigee mindestens einmal jährlich Tisch-BCP/DR-Übungen durch, bei denen Mitglieder des Engineering- und Operations-Teams mit anderen Apigee-Geschäftseinheiten zusammengebracht werden, um Probleme, Reaktionen und die Auswirkungen von Entscheidungen, die in einem simulierten Notfallszenario getroffen wurden, logisch zu simulieren und durchzugehen. Dadurch erhalten unsere Mitarbeiter neben dem Dienst selbst zusätzliche Schulungen und Erfahrungen im Hinblick auf unsere umfassenderen BCP/DR-Pläne für das Unternehmen als Ganzes.

Die von Apigee durchgeführten BCP/DR-Tests verwenden keine „Failover-Übungen“ oder „sekundären Standorte“, da alles in das laufende System integriert ist.

Apigee pflegt Playbooks für alle Betriebs- und Entwicklerteams. Diese Playbooks werden mindestens jährlich überprüft und aktualisiert und in allen unseren BCP/DR-Tests und Trainingsübungen verwendet.

Apigee gibt BCP/DR-Testberichte nicht an einzelne Kunden weiter, da diese Tests auf Plattformebene und nicht auf Kundenebene durchgeführt werden. Wir teilen die Ergebnisse unserer operativen Aufgaben und die jährlichen „Tabletop Test“-Testberichte mit unseren externen Prüfern. Diese bilden die Grundlage für die Prüfung unserer Compliance mit PCI, HIPAA, vertraglichen und anderen Anforderungen durch den Prüfer.

Kunden-BCP/DR-Tests

Kunden wird empfohlen, Apigee Edge-Dienste in ihre eigenen DR-Pläne einzubinden. Der Kunde kann und sollte überlegen, wie Apigee den Traffic nach Bedarf für Kunden weiterleiten kann, um Endnutzerdienste auch während eines Ausfalls des Kundenrechenzentrums oder eines anderen Notfallereignisses aufrechtzuerhalten. Diese Tests sind jedoch nicht im Umfang des Apigee DR-Plans enthalten. Wir empfehlen Kunden, BCP/DR-Tests für ihre eigenen Anwendungen durchzuführen und Apigee Edge in den Test einzubeziehen.

RTO/RPO

Apigee hat für unsere Kunden oder in unseren Verträgen im Zusammenhang mit BCP/DR-Aktivitäten keine Recovery Point and Recovery Time Objectives (RPO/RTO) festgelegt. Unsere SLAs sind das Cloud-Äquivalent der RTO/RPO-Datenpunkte. Da Apigee ein redundanter cloudbasierter Dienst ist, bei dem sowohl Verwaltungs- als auch Laufzeitdienste mit redundanten Live-Diensten erstellt werden, können RTO und RPO beide als „Echtzeit“ betrachtet werden. Kunden mit einer einzelnen Region erhalten ein Minimum an redundanten Diensten in verschiedenen Rechenzentren mit derselben Region. Kunden, die ein höheres Maß an Redundanz wünschen, können sich für multiregionale Dienste entscheiden.

Pandemieplan

Apigee umfasst einen Pandemieplan als Teil unseres allgemeinen BCP/DR-Plans und seiner allgemeinen Prozesse. Da Apigee ein in der Cloud gehosteter Dienst ist, müssen Einzelpersonen das Rechenzentrum nicht verwalten. Für Geschäftstätigkeiten wie den Support betreibt Apigee ein globales Supportteam, das rund um die Uhr an verschiedenen Standorten und an verschiedenen Standorten tätig ist. Wenn sich eine Pandemie in einem Bereich der Welt auf einen unserer Supportstandorte auswirkt, werden die Mitarbeiter in anderen Zweigstellen benachrichtigt und decken die Änderungen ab, die normalerweise vom betroffenen Büro bearbeitet werden. Bei anderen Unternehmensdienstleistungen wie dem Vertrieb ist die Belegschaft weltweit verteilt. Alle Teams bei Apigee können bei Bedarf auch von zu Hause aus arbeiten. Die in Apigee verwendeten Tools sind cloudbasiert und eignen sich ganz natürlich als Reaktion auf die Pandemie.

Updates

Apigee überprüft und aktualisiert unseren BCP/DR-Plan mindestens jährlich. Zur Aktualisierung des Plans werden Informationen aus Vorfällen, Produktänderungen, Branchenstandards, Aktivitäten zur Risikoanalyse und BCP/DB-Tests verwendet.

Geschäftsauswirkungsanalyse und Risikobewertungen

Google führt jährlich eine Geschäftsauswirkungsanalyse und eine Risikobewertung durch. Die Ergebnisse der BIA und der Risikobewertung werden priorisiert und im Problemverfolgungssystem dokumentiert.