异常值检测简介

您正在查看 Apigee Edge 文档。
前往 Apigee X 文档
信息

借助 API Monitoring,您可以创建基于模式的规则,根据一组预定义的条件触发提醒。这些类型的提醒称为“固定”提醒,是 API Monitoring 初始版本支持的唯一一种提醒类型。

例如,您可以在以下情况下发出固定提醒:

  • [目标 mytarget1] 的 [5xx 的错误率] [大于] [10%] 且持续 [10 分钟]
  • [地区 us-east-1] 的 [ 2xx 错误的计数 ] [小于] [50] 且持续 [5 分钟]
  • [代理 myproxy1] 的 [p90 延迟时间] [大于] [750ms] 且持续 [10 分钟]

当满足固定提醒的条件时,API Monitoring 会发出提醒以通知您存在问题。但是,您必须先定义具体的提醒条件,然后 API Monitoring 才会触发提醒。

虽然固定提醒很有用,但可能很难确定条件的正确阈值,因为流量模式会随着时间的推移而变化。例如,如果您将阈值设置得过低,就会收到大量提醒。如果设置的阈值过高,您可能会错过一些重要问题或中断。

异常值检测

通过异常值检测,您可以让 Edge 检测流量和性能问题,而无需自行确定。Edge 会在组织、环境和地区级别自动查找异常值情况。检测到异常值时,会将其记录在 Edge 界面的事件信息中心

异常值检测的工作原理是将人工智能 (AI) 和机器学习 (ML) 模型应用于您的历史 API 数据。然后,异常值检测可以针对您甚至未曾考虑的场景实时触发提醒,以提高生产力,并缩短 API 问题的平均解决时间 (MTTR)。

检测到的异常值示例包括新 API 版本导致流量意外激增以及 API 相应延迟时间增加的情况。或者,后端上配置有误的版本会导致 API 报告的后端错误增加。

检测到的异常值包括以下信息:

  • 导致异常值的指标,例如代理延迟时间或 HTTP 错误代码。
  • 异常值阈值。阈值可以是轻微中度严重

例如,Edge 可以自动检测异常值,例如:

  • [环境 prod、地区 region1] [轻微] [增加 503 错误数]
  • [环境 prod、地区 region2] [中度] [增加 4xx 错误数]
  • [环境 prod、地区 region3] [严重] [增加延迟时间]

通过“事件”信息中心中显示的异常值信息,您可以新建一种提醒(称为异常值提醒),以接收关于这些情况的通知。

异常值类型

Edge 会自动检测以下类型的异常值:

  • 组织、环境和区域级别的 HTTP 503 错误增加
  • 组织、环境和区域级别的 HTTP 504 错误增加
  • 组织、环境和区域层级的所有 HTTP 4xx 或 5xx 错误增加
  • 组织、环境和区域级的第 90 百分位 (p90) 的总响应延迟时间增加

启用异常值检测

默认情况下,Edge 组织和环境会停用异常值检测。如需启用异常值检测,请向 Apigee Edge 支持团队发出请求,为特定组织和环境启用该功能。Apigee 会评估您的环境,并告知您是否可以启用异常值检测。

出于性能原因,不要对所有组织和环境启用异常值检测。Apigee 建议您仅在平均流量负载达到至少 10 个事务/秒 (tps) 的组织和环境中启用异常值检测。

检查异常值检测功能是否已启用

如需检查异常值检测是否已启用,请执行以下操作:

  1. 在 Edge 界面中依次选择分析 > 提醒规则
  2. 选择 + 提醒按钮。系统会打开“创建提醒”面板:

    配置异常值提醒
  3. 选择所需的环境

    如果提醒类型异常值选项显示为灰色,则系统会停用异常值检测。