Planowanie ciągłości działania i odtwarzanie awaryjne

Przeglądasz dokumentację Apigee Edge.
Otwórz dokumentację Apigee X.
Informacje

Apigee to oparta na chmurze platforma obsługująca wielu najemców, która działa w pełni nadmiarowej konfiguracji (w czasie rzeczywistym) w wielu centrach danych w wielu regionach świata. Apigee korzysta z Google Cloud Platform (GCP) i Amazon Web Services (AWS) na naszej platformie działającej w chmurze. W ramach usług, które tworzymy w Google Cloud i AWS, korzystamy z wielu centrów danych w każdym regionie i obsługujemy aktualny ruch w tych licznych centrach danych. Nie mamy „aktywnego” centrum danych ani centrum danych rezerwowego (dodatkowego lub awaryjnego). Mamy co najmniej 2 centra danych stale i jednocześnie obsługują ruch klientów w każdym regionie na całym świecie.

Plan BCP/DR

Apigee Business Continuity Planning and Disaster Recovery (BCP/DR) to plan obejmujący całą platformę i nie zawiera szczegółowych zadań dotyczących poszczególnych klientów. Platforma jest skonfigurowana tak, aby przetwarzać żądania danych klientów niezależnie od zakłóceń i przerw w działaniu usługi. Dane będą przepływać dalej nawet wtedy, gdy całe centrum danych będzie offline. Gdyby cały region przejdzie w tryb offline, w przypadku klienta z 1 regionu może nastąpić przerwa w działaniu usług przetwarzania interfejsów API. Dla klientów szukających czegoś więcej niż „w regionie” nadmiarowych usług Apigee oferuje globalnie nadmiarowy poziom nadmiarowych centrów danych, w których ruch może być obsługiwany w wielu regionach lub krajach. Dzięki temu jeśli cały region zostanie offline, dane nadal będą przepływać.

Usługi dla klientów działające w jednym regionie nie są automatycznie przenoszone do innego regionu z powodu możliwych ograniczeń geograficznych dotyczących przetwarzania danych i dostępu do nich. Apigee hostuje usługi dla klientów w regionie wskazanym przez klienta. Ze względu na obowiązywanie konkretnych przepisów lub zobowiązań klientów wobec użytkowników w lokalizacjach geograficznych danych, Apigee nie przeniesie automatycznie usług do innego regionu, ponieważ mogłoby to spowodować naruszenie zobowiązań Apigee wobec klientów lub zobowiązań Apigee wobec klientów.

Apigee nie udostępnia pełnego planu BCP/DR żadnemu klientowi, ponieważ zawiera wewnętrzne informacje poufne Apigee i odniesienia do naszych klientów. Nasza polityka prywatności uniemożliwia udostępnianie platformy BCP/DR poszczególnym klientom, co mogłoby narazić ich na ujawnienie danych innych klientów. Każdemu klientowi oferujemy taki sam poziom prywatności.

Zarządzanie BCP/DR

Zespół ds. bezpieczeństwa informacji Apigee odpowiada za nadzór nad programem odporności biznesowej, a rotacyjny dowódca odpowiada za zarządzanie wszystkimi incydentami i rozwiązywanie ich. Dowódca incydentu dysponuje personelem operacyjnym i inżynierskim przez cały czas oraz udostępnia poradniki dotyczące wszelkich koniecznych działań.

Testy BCP/DR

Apigee wykonuje procesy operacyjne, które obsługują testowanie BCP/DR platformy w częstszym cyklu niż w ramach pełnego corocznego testowania tabel BCP/DR. Co miesiąc Apigee przeprowadza huśtawki obciążenia ze środowiska aktywnego i aktywnego w czasie, gdy przeprowadza aktualizacje systemów obsługujących tę usługę. Ten proces obejmuje usunięcie systemów z całego centrum danych, gdy obciążenie jest obsługiwane przez równorzędne centrum danych. Podczas tego procesu po przeprowadzeniu aktualizacji przywracane jest pierwsze centrum danych, a usługi są ponownie uruchomione, aby sprawdzić, czy nie wystąpiły żadne problemy. Następnie centrum danych peera zostało przełączone na dostęp do tych samych aktualizacji i ponownie jest online. Apigee używa narzędzi i technik do opróżniania ruchu i wysyłania niewielkiego odsetka ruchu do ostatnio zaktualizowanych usług w celu sprawdzenia, czy nie występują problemy lub błędy, zanim wróci do pełnego przetwarzania obciążenia.

Ten spójny proces operacyjny przekracza standardy branżowe 2 razy w roku „testowanie” odporności naszej usługi, ponieważ staje się ona częstszym zadaniem operacyjnym.

Oprócz opisanych powyżej procesów operacyjnych Apigee co najmniej raz w roku przeprowadza na stole ćwiczenia BCP/DR, podczas których członkowie zespołu technicznego i operacyjnego są połączeni z innymi jednostkami biznesowymi Apigee, aby logicznie symulować i analizować problemy, odpowiedzi oraz wpływ decyzji podjętych w sytuacji katastrofy. Zapewnia to naszym pracownikom dodatkowe szkolenie i możliwość doświadczenia w zakresie większych planów BCP/DR dla całej firmy, a także w zakresie samej usługi.

Testy BCP/DR przeprowadzane przez Apigee nie korzystają z „ćwiczeń awaryjnych” ani „lokalizacji dodatkowych”, ponieważ wszystkie te dane są wbudowane w działający system.

Apigee utrzymuje Poradniki do użytku przez wszystkie zespoły operacyjne i inżynierów. Te poradniki są sprawdzane i aktualizowane co najmniej raz w roku oraz wykorzystywane we wszystkich naszych ćwiczeniach i testach BCP/DR.

Apigee nie udostępnia raportów z testów BCP/DR poszczególnym klientom, ponieważ testy te są przeprowadzane na poziomie platformy, a nie klienta. Udostępniamy wyniki naszych zadań operacyjnych i roczne raporty z testów wykonywanych na stołach zewnętrznym audytorom. Stanowią one podstawę do weryfikacji przez audytorów zgodności z naszymi wymaganiami PCI, HIPAA, umów i innych wymagań.

Testy BCP/DR klienta

Zachęcamy klientów, aby mieli własne plany DR obejmujące usługi Apigee Edge. Klient może i powinien rozważyć sposób, w jaki Apigee może przekierować ruch zgodnie z potrzebami, aby utrzymać usługi użytkowników nawet podczas awarii centrum danych klienta lub innego katastrofy. Ten poziom testowania jest jednak poza zakresem planu Apigee DR. Zachęcamy klientów do wykonywania testów BCP/DR we własnych aplikacjach i uwzględniania w teście Apigee Edge.

RTO/RPO

Apigee nie ma wyznaczonego okresu przywracania (RPO/RTO) dla naszych klientów ani w naszych umowach dotyczących działań związanych z BCP/DR. Nasze gwarancje jakości usług to odpowiednik punktów danych RTO/RPO w chmurze. Apigee to nadmiarowa usługa w chmurze, w której zarówno usługi zarządzania, jak i usługi w środowisku wykonawczym są architektonicznie z użyciem nadmiarowych usług działających w czasie rzeczywistym, więc RTO i RPO mogą być postrzegane w czasie rzeczywistym. Klienci korzystający z jednego regionu otrzymują minimalną liczbę nadmiarowych usług w różnych centrach danych w tym samym regionie. Klienci, którzy chcą osiągnąć wyższy poziom nadmiarowości, mogą wybrać usługi obejmujące wiele regionów.

Plan przeciwdziałania epidemii

Apigee uwzględnia w naszym ogólnym planie i procesach BCP/DR plan związany z pandemią. Apigee jest usługą hostowaną w chmurze, więc nie ma wymogu zarządzania centrum danych przez użytkowników indywidualnych. W przypadku działań biznesowych, takich jak pomoc, Apigee ma globalny zespół pomocy dostępny przez całą dobę, 7 dni w tygodniu w wielu biurach i odległych lokalizacjach. Jeśli pandemia w jednym obszarze świata dotknie jednego z naszych placówek pomocy, pracownicy innych biur zostaną powiadomieni i uwzględnią zmiany, które zwykle są obsługiwane przez odpowiednie biuro. W przypadku innych usług biznesowych, np. sprzedaży, liczba pracowników jest rozproszona globalnie. Wszystkie zespoły w Apigee są przygotowane do pracy zdalnej. Narzędzia używane w Apigee działają w chmurze i w naturalny sposób nadają się do planu reagowania na pandemię.

Aktualizacje

Apigee sprawdza i aktualizuje nasz plan BCP/DR co najmniej raz w roku. Do aktualizowania planu służą informacje zebrane na podstawie incydentów, zmian w usługach, standardów branżowych, działań związanych z analizą ryzyka i testów BCP/DB.

Analiza wpływu na działalność i ocena ryzyka

Google co roku przeprowadza analizę wpływu na działalność i ocenę ryzyka. W systemie śledzenia problemów wyniki analizy i analizowania wniosków są traktowane priorytetowo i udokumentowane.