業務持續性規劃與災難復原

您正在查看 Apigee Edge 說明文件。
查看 Apigee X 說明文件
資訊

Apigee 是多用戶群的自助式雲端式平台,在全球多個地區的多個資料中心內執行全備援 (即時/即時) 設定。Apigee 使用 Google Cloud Platform (GCP) 和 Amazon Web Services (AWS) 做為我們的雲端平台。我們在 GCP 和 AWS 中建構了多項服務,而我們在各地區設置了多個資料中心,並為這些資料中心的客戶提供即時流量服務。我們沒有「即時」資料中心和「待命」(或「次要」或「容錯移轉」) 資料中心。我們有兩座 (或多座) 資料中心持續運作,並同時為各個區域的客戶流量提供服務。

BCP/DR 計畫

Apigee 業務持續性規劃和災難復原 (BCP/DR) 是整個平台的方案,不含個別客戶的詳細工作內容。相反地,這個平台原本設為在不考慮服務中斷和服務中斷的情況下,處理客戶資料要求。即使整個資料中心處於離線狀態,資料仍會持續流動。如果整個區域離線,單一區域客戶可能會遇到 API 處理服務中斷的情況。對於想使用超過「區域內」備援服務的客戶,Apigee 提供全域備援的備援資料中心,讓流量可在多個區域或國家/地區提供服務,這樣一來,即使整個區域離線,資料仍會傳輸。

單一區域的客戶服務不會自動轉移至其他區域,因為資料處理及存取作業可能會受到地理區域限制。Apigee 會為客戶指定區域內的客戶託管服務。由於資料地理位置可能會受特定法規或客戶承諾提供給使用者,因此 Apigee 不會自動將服務遷移至替代區域,因為這可能會影響 Apigee 對客戶或 Apigee 客戶對客戶的承諾。

Apigee 不會向任何個別客戶分享完整的 BCP/DR 計畫,因為其中含有 Apigee 內部機密資訊和客戶參考資料。我們的隱私權政策禁止與個別客戶分享平台 BCP/DR 計畫,以免對方洩漏其他客戶名稱。我們為每位客戶提供同等的隱私防護。

BCP/DR 管理

Apigee 資訊安全團隊負責監督業務韌性計畫,而事件指揮官則負責管理及解決所有事件。事件指揮官,事件指揮官隨時安排營運和工程人員隨時待命,並提供相關教戰手冊,協助應採取所有可能需要採取的行動。

BCP/DR 測試

Apigee 執行的作業程序會比我們全年的 BCP/DR 桌面測試更頻繁,支援平台進行 BCP/DR 測試。我們每個月都會對執行服務的系統進行更新,而 Apigee 每個月都會從即時/即時環境執行負載波動。這項程序包括撤下整個資料中心的系統,同時讓對等互連資料中心處理負載。在此程序中,完成任何更新後,第一個資料中心會恢復,並再次執行即時/上線,確認沒有任何問題發生。接著,對等資料中心因相同的更新而停止運作,接著再重新連線。Apigee 會使用工具和技術降低流量,並將一小部分流量傳送至最近更新的服務,檢查是否有任何問題或錯誤,然後再回到完整負載。

這種一致的作業程序使得我們服務的運作頻率更加頻繁,超越了業界標準的兩年「測試」彈性。

除了上述的作業程序之外,Apigee 還會每年至少執行一次桌上型 BCP/DR 練習,以邏輯方式讓工程和營運團隊成員與其他 Apigee 業務單位合作,以邏輯方式模擬並逐步模擬問題、回覆,以及模擬災難情境中所做的決策影響。這不僅是服務本身,可以為公司整體範圍提供額外的 BCP/DR 計畫,並提供額外的訓練和體驗。

Apigee 執行的 BCP/DR 測試不會使用「容錯移轉練習」或「次要位置」,因為所有這些項目都已內建於執行中系統。

Apigee 會維護應對手冊,供所有營運與工程團隊使用。 我們至少每年都會審查及更新這些教戰手冊,並在所有 BCP/DR 測試和訓練練習中使用。

Apigee 不會與個別客戶分享 BCP/DR 測試報告,因為這些測試是在平台層級 (而非客戶層級) 完成。我們將營運工作的結果和年度桌上運動測試報告分享給第三方稽核機構,這些是稽核員審查是否符合 PCI、健康保險流通與責任法案、合約和其他規定的依據。

客戶 BCP/DR 測試

我們鼓勵客戶自行製定 DR 方案,整合 Apigee Edge 服務。客戶可以且應考慮 Apigee 如何視情況重新導向,以便客戶維護使用者服務,即使在客戶的資料中心服務中斷或其他災難事件期間也是如此。不過,這個層級的測試不在 Apigee DR 計畫的涵蓋範圍內。我們建議客戶對自己的應用程式執行 BCP/DR 測試,並將 Apigee Edge 納入測試。

重返辦公室/RPO

Apigee 未針對客戶或我們的 BCP/DR 活動相關合約設有復原點與復原時間目標 (RPO/RTO),我們的服務水準協議相當於 RTO/RPO 資料點。由於 Apigee 是備援的雲端式服務,透過備援即時服務建構管理和執行階段服務,因此 RTO 和 RPO 皆可視為「即時」。單一區域客戶可以獲得最少量備援服務,服務位於與相同區域相同的不同資料中心。客戶如想提高備援能力,可以選擇使用多區域服務。

疫情方案

Apigee 納入了疫情方案,做為整體 BCP/DR 計畫和程序的一部分。由於 Apigee 是雲端託管服務,因此所有使用者不必管理資料中心。針對支援等業務營運,Apigee 24 小時全年無休,橫跨多個辦公室與偏遠地區的全球支援團隊。如果其中一個世界區域的疫情影響到我們的任一支援地點,其他辦公室的人員會收到通知,並涵蓋平常由受影響辦公室處理的輪班。至於其他商業服務 (例如銷售),員工分佈於全球各地。Apigee 的所有團隊均能視需要遠距工作。Apigee 內的工具是雲端式工具,非常適合做為疫情之下因應計畫使用的工具。

更新

Apigee 至少每年會審查及更新 BCP/DR 計畫,從事件、產品變更、業界標準、風險分析活動和 BCP/DB 測試中收集到的資訊會用於更新計畫。

業務影響分析和風險評估

Google 每年都會進行業務影響分析及進行風險評估。系統會優先處理 BIA 和 RA 的結果,並記錄在問題追蹤系統中。