שיטות מומלצות למעקב

Edge for Private Cloud גרסה 4.17.05

מעקב אחר התראות

ב-Apigee Edge אפשר להעביר התראות ליומני מערכת או למערכות/כלים חיצוניים לניטור כאשר מתרחשת שגיאה או כשל באירוע. ההתראות האלה יכולות להיות התראות/אירועים ברמת המערכת או ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית שנוצרות על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים בהתאמה אישית. למידע נוסף על התראות, יש לפנות לתמיכה של Apigee.

הגדרת סף להתראות

הגדרת סף שאחריו יש ליצור התראה. מה שמגדירים תלוי בהגדרות החומרה. יש לקבוע את הסף ביחס לקיבולת. לדוגמה, יכול להיות ש-Apigee Edge יהיה נמוך מדי אם יש לך קיבולת של 6GB בלבד. אפשר להקצות סף עם קריטריון שווה ל- (=) או גדול מ-(>). אפשר גם לציין מרווח זמן בין שתי התראות רצופות. אפשר להשתמש באפשרות 'שעות/דקות/שניות'.

קריטריונים להגדרת התראות ברמת המערכת

בטבלה הבאה מתוארים הקריטריונים:

התראה

הצעה לסף

תיאור

נפח זיכרון נמוך

500MB

אין מספיק זיכרון כדי להפעיל רכיב

אין מספיק מקום בדיסק (/var/log)

8GB

אין מספיק מקום בכונן.

עומס גבוה

3+

תהליכים הממתינים להרצה גדלו באופן בלתי צפוי

התהליך הופסק

N/A, ערך בוליאני של true או false

תהליך Apigee Java במערכת הופסק

בדיקה של יציאות ספציפיות ל-Apigee ושל צד שלישי

עליך לעקוב אחר היציאות הבאות כדי לוודא שהן פעילות

  • יציאות 4526, 4527 ו-4528 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 1099, 1100 ו-1101 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 8081 ו-15999 בנתבים
  • יציאות 8082 ו-8998 במעבדי הודעות

יציאה 8080 בשרת הניהול: יש לבדוק את יציאות הצד השלישי הבאות כדי לוודא שהן פעילות:

  • יציאה 5672 Qpid
  • יציאה ב-Postgres 5432
  • Cassandra Port 7000, 7199, 9042, 9160
  • נמל גן החיות 2181
  • פתיחת LDAP 10389

כדי לקבוע באיזו יציאה כל רכיב של Apigee מאזין לקריאות ל-API, יש לשלוח את הקריאות הבאות ל-API לשרת הניהול (שבדרך כלל נמצא ביציאה 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכלול קטעים שדומים לזה שמוצג בהמשך. הקטע "http.management.port" מספק את מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

הצגת יומנים

קובצי היומן עוקבים אחרי הודעות בנוגע לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשהתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. הצגת קובצי יומן תאפשר לך לקבל מידע על רכיבי המערכת. לדוגמה: מעבד (CPU), זיכרון, דיסק, טעינה, תהליכים וכו', לפני ואחרי קבלת המצב הכושל. כך אפשר גם לזהות ולאבחן את המקור של בעיות המערכת הנוכחיות, או לחזות את הבעיות הפוטנציאליות במערכת.

לדוגמה, יומן מערכת אופייני של רכיב מכיל את הערכים הבאים:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml כדי לשלוט במנגנון הרישום ביומן בלי להפעיל מחדש את השרת. הקובץ Logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום בודק את הקובץ Logback.xml לצורך זיהוי שינויים בהגדרה:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק אם יש שינויים מדי דקה. אם משמיטים את יחידות הזמן מהמאפיין scanPeriod, ברירת המחדל היא אלפיות השנייה.

בטבלה הבאה מצוין המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.

רכיבים

מיקום

שרת ניהול

opt/apigee/var/log/edge-management-server

נתב

opt/apigee/var/log/edge-router

מעבד בקשות

opt/apigee/var/log/edge-message-processor

שרת Qpid

opt/apigee/var/log/edge-qpid-server

שרת Apigee Postgres

opt/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

קסנדרה

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

מסד נתונים PostgreSQL

opt/apigee/var/log/apigee-postgresql

הפעלה של יומני ניפוי באגים עבור מעבד ההודעות וממשק המשתמש של Edge

כדי להפעיל יומני ניפוי באגים עבור מעבד ההודעות:

  1. בצומת של מעבד ההודעות, עורכים את /opt/apigee/customer/application/messsage-processor.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_system_log.level=DEBUG
  3. מפעילים מחדש את מעבד ההודעות:
    > /opt/apigee/apigee-service/bin/apigee-service edge-message-processor מחדש

כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:

  1. בצומת ממשק המשתמש של Edge, עורכים את /opt/apigee/customer/application/ui.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    > /opt/apigee/apigee-service/bin/apigee-service edge-ui הפעלה מחדש

כלי מעקב

כלי מעקב כמו Nagios , Collectd , Graphite , Splunk , Sumologic ו-Monit יכולים לעזור לכם לעקוב אחר כל הסביבה הארגונית והתהליכים העסקיים.

רכיב

נגיוס

נאספו

Splunk

בדיקות ברמת המערכת

ניצול המעבד (CPU)

?

?

זיכרון פנוי/משומש

?

?

ניצול נפח האחסון

?

?

סטטיסטיקות רשת

?

?

תהליכים

?

בדיקות API

?

JMX

?

Java

?

קובצי יומן

?

אירועים קריטיים

הגעת למגבלת הקצב של יצירת הבקשות

?

לא ניתן לגשת לשרת הקצה העורפי (Hybris או SharePoint)

?

לא ניתן להגיע אל ה-FaaS (STS)

?

אירועי אזהרה

לא ניתן להתחבר לשרת ה-SMTP

?

הסכם רמת השירות הפר

?