異常偵測的運作方式

您正在查看 Apigee Edge 說明文件。
查看 Apigee X 說明文件
資訊

異常偵測包含三個主要階段:

訓練模型

異常偵測的運作方式是從歷來的時間序列資料中訓練 API Proxy 行為的模型。您無須採取任何行動即可訓練模型。Edge 會根據過去六小時的流量資料自動建立及訓練模型。因此,Edge 需要至少六小時的 API Proxy 資料訓練模型,才能訓練模型,然後才能記錄異常狀況。

記錄異常事件

在執行階段,Edge 異常偵測會將 API Proxy 的目前行為與模型預測的行為進行比較。這樣一來,當操作指標超出預測值時,異常偵測就會以特定可信度門檻判斷。舉例來說,5xx 錯誤率超出模型預測的速率時。

當 Edge 偵測到異常狀況時,就會自動將條件記錄到 Edge UI 中的事件資訊主頁。Edge 會記錄每次偵測到的異常狀況,並記錄輕微、中等或嚴重的可信度門檻。例如,嚴重異常狀況就是信賴度極高的異常狀況。

「事件」資訊主頁中顯示的事件清單包含 Edge 偵測到的所有異常狀況,以及所有觸發的快訊。快訊可能是固定快訊或異常快訊。

如何查看異常狀況:

  1. 在 Edge UI 中,依序按一下「分析」>「事件」。新的「事件」資訊主頁會顯示: 在「事件」資訊主頁查看異常事件
  2. 依下列條件篩選「事件」資訊主頁:
    • 環境
    • 區域
    • 事件類型為「快訊」 (固定和異常) 或「異常」
    • 異常狀況門檻 (僅限異常狀況)
    • 時間範圍

如何細查異常狀況:

  1. 在「事件」資訊主頁選取「異常狀況」資料列,即可在 API Monitoring 的調查資訊主頁中開啟異常狀況。在以下範例中,您將調查 P90 延遲時間有些微增加的異常狀況。黃色直線代表發生異常狀況的位置:

    調查異常事件
  2. 選取畫面中的區塊,即可查看異常狀況詳細資料:

    查看異常狀況詳細資料
  3. 選取「意見回饋:這項異常狀況的準確度」,以便向 Apigee 提供意見回饋,協助改善異常偵測作業。請使用此連結指定流量模式是否為實際異常狀況、偵測結果的實用程度,並視需求留言:

    提交異常狀況意見回饋

產生快訊

根據預設,Edge 會產生異常事件,但不會引發異常狀況快訊。您可自行決定是否要查看「事件」資訊主頁,判斷偵測到的異常狀況是否為實際問題 (按照計算的門檻值)。如果是的話,您可以在目前或不同門檻層級針對該異常狀況建立快訊。下次發生異常狀況時,Edge 會發出快訊,然後會傳送電子郵件或其他類型的通知給您。

注意:提高快訊後,Edge 不會再次發出相同的快訊,直至已經過 10 分鐘,且快訊觸發條件仍然存在。此間隔可防止 Edge 針對相同條件發出重複的快訊。

如何建立異常快訊:

  1. 在「事件」資訊主頁選取異常狀況,即可查看上述異常狀況詳細資料 (如上所示)。
  2. 在異常詳細資料中選取「建立快訊」按鈕。建立快訊面板會隨即開啟。
  3. 設定快訊。您在以下範例中設定了快訊,讓系統對任何區域的 prod 環境稍微增加 p90 延遲時間:

    設定異常快訊

  4. 按一下「+ 通知」即可新增快訊通知。

    通知詳細資訊 說明
    頻道 選取您要使用的通知管道,並指定目的地:Email、Slack、PagerDuty 或 Webhook。
    目的地

    根據所選頻道類型指定目的地:

    • 電子郵件:電子郵件地址,例如 joe@company.com
    • Slack - Slack 頻道網址,例如 https://hooks.slack.com/services/T00000000/B00000000/XXXXX
    • PagerDuty:PagerDuty 程式碼,例如 abcd1234efgh56789
    • Webhook - Webhook 網址,例如 https://apigee.com/test-webhook

    注意:每則通知只能指定一個目的地。如要為同一頻道類型指定多個目的地,請新增其他通知。

  5. 如要新增其他通知,請重複步驟 4。
  6. 如果您已經新增通知,請設定下列欄位:
    欄位 說明
    節流 傳送通知的頻率。從下拉式清單中選取所需的值。
  7. 點按「儲存」

    系統會在下次發生異常狀況時通知您。