異常検出について

Apigee Edge のドキュメントを表示しています。
Apigee X のドキュメントに移動
情報

API Monitoring を使用すると、事前に定義された一連の条件に基づいてアラートをトリガーする、パターンベースのルールを作成できます。この種類のアラートは固定アラートと呼ばれ、API Monitoring の初期リリースでサポートされていた唯一のアラートです。

たとえば次の場合に、固定アラートを生成できます。

  • "mytarget1 ターゲット" から "10 分間" で "5xx エラーの発生率" が "10%" "より大きい"
  • [2xx エラーのカウント] が [us-east-1 リージョン] で [5 分間] に [50] [より小さい]
  • "p90 レイテンシ" が "myproxy1 プロシキ" で "10 分間" に "750 ミリ秒" "より大きい"

固定アラートの条件が満たされると、API Monitoring により問題を知らせるアラートが生成されます。ただし、API Monitoring でアラートを発生させるには、具体的なアラート条件を定義しておく必要があります。

固定アラートは役に立ちますが、時間の経過とともにトラフィック パターンは変化するため、条件の適切なしきい値を判断するのは困難です。たとえば、しきい値を低く設定すると、アラートでいっぱいになってしまいます。しきい値を高く設定すると、重大な問題や機能の停止を見逃す可能性があります。

異常の検出

異常検出では、トラフィックとパフォーマンスに関する問題を Edge で検出できるため、自分であらかじめ決めておく必要はありません。Edge は、組織レベル、環境レベル、リージョン レベルで異常条件を自動的に探索します。異常が検出されると、Edge UI の [イベント] ダッシュボードに表示されます。

異常検出は、人工知能(AI)モデルと機械学習(ML)モデルを履歴 API データに適用することによって機能します。さらに、異常検出を使用すると、生産性の向上や、API の問題の平均修復時間(MTTR)の短縮に悩むことなく、リアルタイムでアラートを生成できます。

検出される異常の例には、新しい API リリースによりトラフィックが予想外に増加し、対応する API のレイテンシが増加しているケースも含まれます。あるいは、誤りがあるバックエンド構成のリリースによって、API から報告されるバックエンド エラーが増加しているケースなどです。

検出された異常には次の情報が含まれます。

  • プロキシのレイテンシや HTTP エラーコードなど、異常の原因となった指標。
  • 異常のしきい値。しきい値は、軽微(slight)、中程度(moderate)、重大(severe)のいずれかになります。

たとえば、Edge では、次のような異常が自動的に検出されます。

  • [region1 リージョンの prod 環境] で [slight](わずか)に [503 エラーが増加]
  • [region2 リージョンの prod 環境] で [moderate](ある程度)[4xx エラーが増加]
  • [region3 リージョンの prod 環境] で、[severe](著しく)[レイテンシが増加]

[Events] ダッシュボードに表示される異常情報から、異常アラートと呼ばれる新しいアラートを作成して、こうした条件を通知できます。

異常の種類

Edge では、次の種類の異常を自動的に検出します。

  • 組織、環境、リージョン レベルでの HTTP 503 エラーの増加
  • 組織、環境、リージョン レベルでの HTTP 504 エラーの増加
  • 組織、環境、リージョン レベルでのすべての HTTP 4xx または 5xx エラーの増加
  • 組織、環境、リージョン レベルでの、90 パーセンタイル(p90)に位置する合計レスポンス レイテンシの増加

異常の検出を有効にする

Edge の組織と環境では、デフォルトで異常検出は無効になっています。異常検出を有効にするには、Apigee Edge サポートにリクエストして、特定の組織と環境で有効にします。Apigee でその環境が評価され、異常検出を有効にできるかどうかが通知されます。

パフォーマンス上の理由から、異常検出は、すべての組織と環境に対して有効にしないでください。異常検出は平均して 1 秒あたり 10 トランザクション(tps)の負荷がある組織と環境でのみ有効にすることをおすすめします。

異常の検出が有効かどうかを確認する

異常検出が有効かどうかを確認するには、次のようにします。

  1. Edge UI で [Analyze] > [Alert Rules] を選択します。
  2. [+ アラート] ボタンを選択します。[アラートを作成] パネルが開きます。

    異常アラートの設定
  3. 目的の環境を選択します。

    [Alert type] で [Anomaly] オプションがグレー表示されている場合、異常検出は無効です。