שיטות מומלצות למעקב

מעקב אחרי התראות

Apigee Edge מאפשר להעביר התראות ל-syslogs או למערכות/כלים חיצוניים למעקב כשמתרחשת שגיאה או כשל בגלל כשל באירוע. ההתראות האלה יכולות להיות התראות/אירועים ברמת המערכת או ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות בהתאמה אישית שנוצרות על סמך אירועים שנוצרו. בדרך כלל, האדמין של הרשת מגדיר את התנאים המותאמים אישית. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.

הגדרת ערכי סף לקבלת התראות

מגדירים סף שבו צריכה להופיע התראה. ההגדרה תלויה בהגדרת החומרה. צריך להגדיר את הסף בהתאם לקיבולת שלכם. לדוגמה, יכול להיות ש-Apigee Edge לא יתאים לכם אם יש לכם רק קיבולת של 6GB. אפשר להקצות ערך סף עם קריטריון של שווה ל-(=) או גדול מ-(>). אפשר גם לציין מרווח זמן בין שתי התראות רצופות. אפשר להשתמש באפשרות 'שעות/דקות/שניות'.

קריטריונים להגדרת התראות ברמת המערכת

בטבלה הבאה מתוארים הקריטריונים:

התרעה ערך הסף המוצע תיאור

נפח זיכרון נמוך

500MB

אין מספיק זיכרון כדי להפעיל רכיב

נפח האחסון בדיסק נמוך (‎/var/log)

8GB

נפח האחסון בכונן קטן מדי.

עומס גבוה

3+

מספר התהליכים שממתינים להרצה גדל באופן בלתי צפוי

התהליך הופסק

N/A, ערך בוליאני של true או false

תהליך Java של Apigee במערכת הופסק

בדיקה של יציאות ספציפיות ל-Apigee ויציאות של צד שלישי

עוקבים אחרי היציאות הבאות כדי לוודא שהן פעילות

  • יציאות 4526, ‏ 4527 ו-4528 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 1099, ‏ 1100 ו-1101 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 8081 ו-15999 בנתבים
  • יציאות 8082 ו-8998 במעבדי בקשות
  • יציאה 8080 בשרת הניהול

בודקים את יציאות הצד השלישי הבאות כדי לוודא שהן פעילות:

  • יציאת Qpid 5672
  • יציאה 5432 של Postgres
  • יציאות של Cassandra: 7000, 7199, 9042, 9160
  • יציאת ZooKeeper 2181
  • יציאת OpenLDAP 10389

כדי לקבוע באיזה יציאה כל רכיב של Apigee מקשיב לקריאות API, צריך להפעיל את קריאות ה-API הבאות לשרת הניהול (בדרך כלל ביציאה 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכלול קטעים שדומים לקטעים שמוצגים בהמשך. בקטע http.management.port מצוין מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

הצגת יומנים

קובצי יומן עוקבים אחרי הודעות לגבי האירוע או הפעולה של המערכת. הודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחשת שגיאה. הצגת קובצי יומנים מאפשרת לקבל מידע על רכיבי המערכת, למשל מעבד (CPU), זיכרון, דיסק, עומס, תהליכים וכו', לפני ואחרי הגעה למצב 'כשל'. כך תוכלו גם לזהות ולנתח את המקור לבעיות קיימות במערכת, או לחזות בעיות פוטנציאליות במערכת.

לדוגמה, יומן מערכת טיפוסי של רכיב מכיל את הרשומות הבאות, כפי שמוצג בהמשך:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml כדי לשלוט במנגנון הרישום ביומן בלי להפעיל מחדש את השרת. קובץ logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום ביומן בודק את קובץ logback.xml כדי לזהות שינויים בתצורה:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק אם יש שינויים בכל דקה. אם משמיטים את יחידות הזמן במאפיין scanPeriod, ברירת המחדל היא אלפיות שנייה.

בטבלה הבאה מפורט המיקום של קובצי היומנים של רכיבי Apigee Edge Private Cloud.

רכיבים מיקום

שרת ניהול

opt/apigee/var/log/edge-management-server

נתב

opt/apigee/var/log/edge-router

מעבד בקשות

opt/apigee/var/log/edge-message-processor

שרת Qpid

opt/apigee/var/log/edge-qpid-server

שרת Postgres של Apigee

opt/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

מסד נתונים של PostgreSQL

opt/apigee/var/log/apigee-postgresql

הפעלת יומני ניפוי באגים למעבד ההודעות ולממשק המשתמש של Edge

כדי להפעיל יומני ניפוי באגים לעיבוד הודעות:

  1. עורכים את הערך של /opt/apigee/customer/application/messsage-processor.properties בצומת Message Processor. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים לקובץ את המאפיין הבא:
    conf_system_log.level=DEBUG
  3. מפעילים מחדש את מעבד ההודעות:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

כדי להפעיל יומני ניפוי באגים לממשק המשתמש של Edge:

  1. עורכים את /opt/apigee/customer/application/ui.properties בצומת של ממשק המשתמש של Edge. אם הקובץ הזה לא קיים, יוצרים אותו.
  2. מוסיפים לקובץ את המאפיין הבא:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

שיטות מומלצות ל-apigee-monit

כשמשתמשים ב-apigee-monit, מומלץ ב-Apigee:

כלים למעקב

כלים למעקב כמו Nagios,‏ Collectd,‏ Graphite,‏ Splunk,‏ Sumologic ו-Monit יכולים לעזור לכם לעקוב אחרי כל הסביבה הארגונית והתהליכים העסקיים.

רכיב Nagios Collectd Splunk

בדיקות ברמת המערכת

ניצול המעבד

זיכרון פנוי/בשימוש

ניצול שטח האחסון

סטטיסטיקות רשת

תהליכים

בדיקות API

JMX

Java

קובצי יומן

אירועים קריטיים

אירוע של הגבלת קצב

לא ניתן לגשת לשרת הקצה העורפי (Hybris או SharePoint)

לא ניתן להגיע ל-FaaS (STS)

אירועי אזהרה

לא ניתן להתחבר לשרת ה-SMTP

הפרות של הסכמי רמת שירות