업무 연속성 계획 및 재해 복구

현재 Apigee Edge 문서가 표시되고 있습니다.
Apigee X 문서로 이동
정보

Apigee는 전 세계 여러 리전에 있는 여러 데이터 센터에서 완전한 중복성(라이브/라이브) 구성으로 실행되는 멀티 테넌트, 셀프서비스 방식의 클라우드 기반 플랫폼입니다. Apigee는 Google Cloud Platform (GCP)과 Amazon Web Services (AWS)를 클라우드 기반 플랫폼에 사용합니다. GCP 및 AWS에서 빌드하는 서비스의 일부로 각 리전 내에서 여러 데이터 센터를 사용하고 여러 데이터 센터에서 고객에게 실시간 트래픽을 제공합니다. '라이브' 데이터 센터와 '대기' (또는 '보조' 또는 '장애 조치') 데이터 센터는 없습니다. Google은 2개 이상의 데이터 센터를 지속적으로 운영하고 있으며 동시에 전 세계 각 리전에서 고객 트래픽을 서비스하고 있습니다.

BCP/DR 계획

Apigee 업무 연속성 계획 및 재해 복구 (BCP/DR)는 플랫폼 전체에 적용되는 계획이며 개별 고객을 위한 세부 작업을 포함하지 않습니다. 대신 중단 및 서비스 중단과 관계없이 고객 데이터 요청을 처리하도록 구성되어 있습니다. 데이터 센터 전체가 오프라인 상태여도 데이터는 계속 전송됩니다. 전체 리전이 오프라인으로 전환되면 단일 리전 고객의 API 처리 서비스가 중단될 수 있습니다. '리전 내' 중복 서비스 이상을 찾는 고객을 위해 Apigee는 여러 리전 또는 국가에서 트래픽을 처리할 수 있는 글로벌 중복 수준의 중복 데이터 센터를 제공하므로 전체 리전이 오프라인 상태가 되어도 데이터가 계속 흐르게 됩니다.

단일 리전 고객 서비스는 데이터 처리 및 액세스에 대한 지리적 제한으로 인해 다른 리전으로 자동으로 전송되지 않습니다. Apigee는 고객이 파악한 리전의 고객을 위해 서비스를 호스팅합니다. 데이터의 지리적 위치에 대한 특정 규정이나 고객의 약정이 있을 수 있으므로 Apigee는 서비스를 대체 리전으로 자동 이전하지 않습니다. 이 경우 Apigee가 고객에 대한 Apigee의 약정 또는 Apigee 고객이 고객에 대한 약속을 침해할 수 있습니다.

Apigee에는 Apigee 내부의 민감한 정보와 고객에 대한 참조가 포함되어 있으므로 전체 BCP/DR 요금제를 개별 고객과 공유하지 않습니다. Google 개인정보처리방침은 다른 고객 이름을 노출할 가능성이 있는 개별 고객과 플랫폼 BCP/DR 계획을 공유하지 못하도록 합니다. Google은 각 고객에게 동일한 수준의 개인 정보 보호 기능을 제공합니다.

BCP/DR 관리

Apigee 정보 보안팀은 비즈니스 복원력 프로그램에 대한 감독 업무를 담당하며, 순환하는 이슈 지휘관은 모든 이슈의 관리 및 해결을 담당합니다. 이슈 지휘관은 상시 운영 및 엔지니어링 인력을 상시 대기하며 필요한 모든 조치에 대한 플레이북을 작성합니다.

BCP/DR 테스트

Apigee는 플랫폼의 BCP/DR 테스트를 지원하는 운영 프로세스를 전체 연간 BCP/DR 테이블탑 테스트보다 더 빈번하게 수행합니다. Apigee는 매달 서비스를 실행하는 시스템에 대한 업데이트를 수행하는 동안 실시간/실시간 환경에서 부하를 스윙합니다. 이 프로세스에는 피어 데이터 센터에서 부하를 처리하는 동안 데이터 센터 전체의 시스템을 중단하는 작업이 포함됩니다. 이 프로세스 중에 업데이트가 수행된 후 첫 번째 데이터 센터가 다시 가동되고 서비스가 다시 라이브/라이브로 실행되어 문제가 발생하지 않았는지 확인합니다. 그런 다음 동일한 업데이트를 위해 피어 데이터 센터가 종료된 후 다시 온라인 상태로 전환됩니다. Apigee는 도구와 기술을 사용하여 트래픽을 드레이닝하고 트래픽의 일부를 최근 업데이트된 서비스로 보내 문제나 오류가 있는지 확인한 후 전체 로드 처리로 돌아갑니다.

이 일관된 운영 프로세스는 서비스가 더 자주 발생하는 운영 태스크가 되도록 함으로써 Google 서비스의 업계 표준 반기별 복원력 '테스트'를 넘어섭니다.

위에 설명된 운영 프로세스 외에도 Apigee는 엔지니어링팀 및 운영팀이 다른 Apigee 사업부와 함께 모의 재난 시나리오에서 문제, 대응, 의사 결정의 영향을 논리적으로 시뮬레이션하고 살펴보는 식탁 BCP/DR 연습을 1년에 한 번 이상 수행합니다. 이를 통해 Google 직원에게는 서비스 자체뿐만 아니라 기업 전반에 대한 대규모 BCP/DR 계획에 대한 추가 교육과 경험이 제공됩니다.

Apigee가 수행하는 BCP/DR 테스트는 '장애 조치 연습' 또는 '보조 위치'를 사용하지 않습니다. 이러한 모든 기능이 실행 시스템에 내장되어 있기 때문입니다.

Apigee는 모든 운영 및 엔지니어링팀에서 사용할 수 있도록 플레이북을 관리합니다. 이 플레이북은 적어도 1년에 한 번 검토 및 업데이트되며 모든 BCP/DR 테스트 및 학습 실습에 사용됩니다.

BCP/DR 테스트 보고서는 고객 수준이 아닌 플랫폼 수준에서 실행되므로 Apigee는 개별 고객과 공유하지 않습니다. 당사는 운영 작업 및 연례 탁자 실습 테스트 보고서를 제3자 감사 기관과 공유하며, 이러한 결과는 감사관이 PCI, HIPAA, 계약 및 기타 요구사항 준수를 검토하는 기준이 됩니다.

고객 BCP/DR 테스트

고객은 자체 DR 계획을 통해 Apigee Edge 서비스를 통합하는 것이 좋습니다. 고객은 고객 데이터 센터가 중단되거나 기타 재해 이벤트 시에도 최종 사용자 서비스를 유지하는 데 필요한 만큼 Apigee에서 트래픽을 리디렉션할 수 있는 방법을 고려해야 합니다. 그러나 이 테스트 수준은 Apigee DR 계획의 범위를 벗어납니다. 고객은 자체 애플리케이션에서 BCP/DR 테스트를 수행하고 Apigee Edge를 테스트에 포함하는 것이 좋습니다.

RTO/RPO

Apigee에는 고객의 복구 지점 및 복구 시간 목표 (RPO/RTO)가 없거나 BCP/DR 활동과 관련된 계약에 명시되어 있지 않습니다. Google의 SLA는 클라우드에서 RTO/RPO 데이터 포인트에 상응합니다. Apigee는 관리 및 런타임 서비스가 중복 라이브 서비스로 설계되는 중복 클라우드 기반 서비스이므로 RTO와 RPO를 '실시간'으로 볼 수 있습니다. 단일 리전 고객은 동일한 리전의 여러 데이터 센터에서 최소한의 중복 서비스를 받습니다. 더 높은 수준의 중복성이 필요한 고객은 멀티 리전 서비스를 선택할 수 있습니다.

팬데믹 계획

Apigee에는 전반적인 BCP/DR 계획 및 프로세스의 일부로 팬데믹 계획이 포함되어 있습니다. Apigee는 클라우드 호스팅 서비스이므로 개인이 데이터 센터를 관리할 필요가 없습니다. 지원과 같은 비즈니스 운영의 경우 Apigee는 여러 사무실과 원격 위치에서 연중무휴 24시간 글로벌 지원팀을 운영합니다. 전 세계에 분포된 Google 지원 위치 중 한 곳이 팬데믹의 영향을 크게 받는 경우, 다른 사무소에 알림이 제공되고 해당 사무소에서 일반적으로 처리되는 업무를 지원하게 됩니다. 판매와 같은 기타 비즈니스 서비스의 경우 인력이 전 세계에 분산되어 있습니다. Apigee의 모든 팀은 필요한 경우 원격 근무를 할 수 있습니다. Apigee에서 사용되는 도구는 클라우드를 기반으로 하며 팬데믹 대응 계획에 자연스럽게 적합합니다.

업데이트

Apigee는 적어도 1년에 한 번 BCP/DR 계획을 검토하고 업데이트합니다. 이슈, 제품 변경, 업계 표준, 위험 분석 활동, BCP/DB 테스트에서 수집한 정보가 계획을 업데이트하는 데 사용됩니다.

비즈니스 영향 분석 및 위험 평가

Google은 비즈니스 영향 분석 및 위험 평가를 매년 수행합니다. BIA 및 RA의 결과는 문제 추적 시스템에 우선시되고 문서화됩니다.