เกี่ยวกับการตรวจจับความผิดปกติ

คุณกำลังดูเอกสารประกอบของ Apigee Edge
ไปที่เอกสารประกอบของ Apigee X
ข้อมูล

การตรวจสอบ API ช่วยให้คุณสร้างกฎที่อิงตามรูปแบบซึ่งจะทริกเกอร์การแจ้งเตือนโดยอิงตามชุดเงื่อนไขที่กำหนดไว้ล่วงหน้า การแจ้งเตือนประเภทนี้เรียกว่าการแจ้งเตือนที่แก้ไขแล้ว และเป็นเพียงการแจ้งเตือนประเภทเดียวที่รองรับใน API Monitoring รุ่นแรก

ตัวอย่างเช่น คุณสามารถเพิ่มการแจ้งเตือนแบบคงที่ในกรณีต่อไปนี้

  • [อัตราข้อผิดพลาด 5xx] [มากกว่า] [10%] เป็นเวลา [10 นาที] จาก [target mytarget1]
  • [จำนวนข้อผิดพลาด 2xx] [น้อยกว่า] [50] เป็นเวลา [5 นาที] ใน [ภูมิภาค us-east-1]
  • [เวลาในการตอบสนอง p90] [มากกว่า] [750ms] เป็นเวลา [10 นาที] ใน [proxy myproxy1]

เมื่อเป็นไปตามเงื่อนไขของการแจ้งเตือนที่แก้ไขแล้ว API Monitoring จะส่งการแจ้งเตือนเพื่อแจ้งให้คุณทราบ อย่างไรก็ตาม คุณต้องกำหนดเงื่อนไขในการแจ้งเตือนเฉพาะก่อน การตรวจสอบ API จึงจะเพิ่มการแจ้งเตือนได้

แม้ว่าการแจ้งเตือนที่แก้ไขจะมีคุณค่า แต่ก็เป็นเรื่องยากที่จะกําหนดเกณฑ์ที่เหมาะสมสําหรับเงื่อนไขหนึ่งๆ เนื่องจากรูปแบบการเข้าชมมีการเปลี่ยนแปลงเมื่อเวลาผ่านไป ตัวอย่างเช่น หากคุณกำหนดเกณฑ์ต่ำเกินไป ระบบจะแจ้งเตือนผู้ใช้อย่างท่วมท้น หากกำหนดเกณฑ์สูงเกินไป คุณอาจพลาดปัญหาสำคัญหรือการหยุดทำงาน

การตรวจจับความผิดปกติ

การตรวจจับความผิดปกติจะช่วยให้คุณอนุญาตให้ Edge ตรวจหาปัญหาด้านการเข้าชมและประสิทธิภาพได้ แทนที่จะต้องกำหนดค่าล่วงหน้าด้วยตนเอง Edge จะมองหาเงื่อนไขความผิดปกติในระดับองค์กร สภาพแวดล้อม และภูมิภาคโดยอัตโนมัติ เมื่อตรวจพบ ระบบจะบันทึกความผิดปกติดังกล่าวเพื่อแสดงในแดชบอร์ดเหตุการณ์ใน Edge UI

การตรวจจับความผิดปกติทำงานโดยใช้โมเดลปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิง (ML) กับข้อมูล API ที่ผ่านมา จากนั้นการตรวจจับความผิดปกติจะเพิ่มการแจ้งเตือนแบบเรียลไทม์สำหรับสถานการณ์ที่คุณไม่เคยนึกถึงมาก่อนเพื่อเพิ่มประสิทธิภาพการทำงานและลดความผิดพลาดในการแปลงข้อมูล (MTTR) ของปัญหา API ของคุณ

ตัวอย่างของความผิดปกติที่ตรวจพบอาจรวมถึงสถานการณ์ที่การเปิดตัว API ใหม่ทำให้เกิดการเพิ่มขึ้นของการเข้าชมที่ไม่คาดคิดและเวลาในการตอบสนองที่เพิ่มขึ้นสำหรับ API หรือการเปิดตัวที่กำหนดค่าไม่ถูกต้องในแบ็กเอนด์จะทำให้มีข้อผิดพลาดเกี่ยวกับแบ็กเอนด์ที่รายงานโดย API เพิ่มขึ้น

ความผิดปกติที่ตรวจพบประกอบด้วยข้อมูลต่อไปนี้

  • เมตริกที่ทำให้เกิดความผิดปกติ เช่น เวลาในการตอบสนองของพร็อกซีหรือรหัสข้อผิดพลาด HTTP
  • เกณฑ์ของความผิดปกติ เกณฑ์อาจเป็นเล็กน้อย ปานกลาง หรือรุนแรง

ตัวอย่างเช่น Edge จะตรวจจับความผิดปกติได้โดยอัตโนมัติ เช่น

  • [เล็กน้อย] [uptick in 503 errors] ใน [environment prod, regionregion1]
  • [ระดับปานกลาง] [uptick in 4xx errors] ใน [environment prod, แบบออฟไลน์region2]
  • [เวลาในการตอบสนองที่เพิ่มขึ้น] [เวลาในการตอบสนองที่เพิ่มขึ้น] ใน [environment prod, region3]

จากข้อมูลความผิดปกติที่แสดงในหน้าแดชบอร์ดเหตุการณ์ คุณสามารถสร้างการแจ้งเตือนประเภทใหม่ที่เรียกว่าการแจ้งเตือนความผิดปกติเพื่อแจ้งให้คุณทราบถึงเงื่อนไขเหล่านี้ได้

ประเภทความผิดปกติ

Edge จะตรวจหาความผิดปกติประเภทต่อไปนี้โดยอัตโนมัติ

  • ข้อผิดพลาด HTTP 503 เพิ่มขึ้นในระดับองค์กร สภาพแวดล้อม และภูมิภาค
  • ข้อผิดพลาด HTTP 504 เพิ่มขึ้นในระดับองค์กร สภาพแวดล้อม และภูมิภาค
  • ข้อผิดพลาด HTTP 4xx หรือ 5xx ทั้งหมดจะมีเพิ่มขึ้นในระดับองค์กร สภาพแวดล้อม และภูมิภาค
  • เพิ่มเวลาในการตอบสนองรวมสำหรับเปอร์เซ็นไทล์ที่ 90 (p90) ที่ระดับองค์กร สภาพแวดล้อม และภูมิภาค

เปิดใช้การตรวจจับความผิดปกติ

โดยค่าเริ่มต้น การตรวจจับความผิดปกติจะปิดอยู่สำหรับองค์กรและสภาพแวดล้อม Edge หากต้องการเปิดใช้การตรวจจับความผิดปกติ โปรดส่งคำขอไปยังฝ่ายสนับสนุนของ Apigee Edge เพื่อเปิดใช้การตรวจจับความผิดปกติ Apigee จะประเมินสภาพแวดล้อมและแจ้งให้ทราบว่าเปิดใช้การตรวจจับความผิดปกติได้หรือไม่

อย่าเปิดใช้การตรวจจับความผิดปกติในองค์กรและสภาพแวดล้อมทั้งหมดเนื่องจากเหตุผลด้านประสิทธิภาพ Apigee ขอแนะนำให้คุณเปิดใช้การตรวจจับความผิดปกติในองค์กรและสภาพแวดล้อมที่มีปริมาณการรับส่งข้อมูลเฉลี่ยอย่างน้อย 10 รายการต่อวินาที (tps) เท่านั้น

ตรวจสอบว่าเปิดใช้การตรวจจับความผิดปกติหรือไม่

วิธีตรวจสอบว่าการตรวจจับความผิดปกติเปิดอยู่หรือไม่

  1. เลือกวิเคราะห์ > กฎการแจ้งเตือนใน Edge UI
  2. เลือกปุ่ม + การแจ้งเตือน การสร้างแผงการแจ้งเตือนจะเปิดขึ้น ดังนี้

    กำหนดค่าการแจ้งเตือนความผิดปกติ
  3. เลือกสภาพแวดล้อมที่ต้องการ

    หากตัวเลือกความผิดปกติเป็นสีเทาสำหรับประเภทการแจ้งเตือน ระบบจะปิดใช้การตรวจจับความผิดปกติ