שיטות מומלצות למעקב

Edge for Private Cloud גרסה 4.18.05

מעקב אחר התראות

ב-Apigee Edge אפשר להעביר התראות ליומני מערכת או למערכות/כלים חיצוניים לניטור כאשר מתרחשת שגיאה או כשל באירוע. ההתראות האלה יכולות להיות התראות/אירועים ברמת המערכת או ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית שנוצרות על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים בהתאמה אישית. למידע נוסף על התראות, יש לפנות לתמיכה של Apigee.

הגדרת ערכי סף לקבלת התראות

הגדרת סף שאחריו יש ליצור התראה. מה שמגדירים תלוי בהגדרות החומרה. יש לקבוע את הסף ביחס לקיבולת. לדוגמה, יכול להיות ש-Apigee Edge יהיה נמוך מדי אם יש לך קיבולת של 6GB בלבד. אפשר להקצות סף עם קריטריון שווה ל- (=) או גדול מ-(>). אפשר גם לציין מרווח זמן בין שתי התראות רצופות. אפשר להשתמש באפשרות 'שעות/דקות/שניות'.

קריטריונים להגדרת התראות ברמת המערכת

בטבלה הבאה מתוארים הקריטריונים:

התרעה סף מוצע התיאור

נפח זיכרון נמוך

500MB

אין מספיק זיכרון כדי להפעיל רכיב

אין מספיק מקום בדיסק (/var/log)

8GB

אין מספיק מקום בכונן.

עומס גבוה

3+

תהליכים הממתינים להרצה גדלו באופן בלתי צפוי

התהליך הופסק

N/A, ערך בוליאני של true או false

תהליך Apigee Java במערכת הופסק

בדיקה של יציאות ספציפיות ל-Apigee ושל צד שלישי

עליך לעקוב אחר היציאות הבאות כדי לוודא שהן פעילות

  • יציאות 4526, 4527 ו-4528 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 1099, 1100 ו-1101 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 8081 ו-15999 בנתבים
  • יציאות 8082 ו-8998 במעבדי הודעות
  • יציאה 8080 בשרת הניהול

כדאי לבדוק את היציאות הבאות של צד שלישי כדי לוודא שהן פעילות:

  • יציאה 5672 Qpid
  • יציאה ב-Postgres 5432
  • Cassandra Port 7000, 7199, 9042, 9160
  • נמל גן החיות 2181
  • פתיחת LDAP 10389

כדי לקבוע באיזו יציאה כל רכיב של Apigee מאזין לקריאות ל-API, יש לשלוח את הקריאות הבאות ל-API לשרת הניהול (שבדרך כלל נמצא ביציאה 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכלול קטעים שדומים לזה שמוצג בהמשך. בקטע http.management.port מופיע מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

הצגת יומנים

קובצי היומן עוקבים אחרי הודעות בנוגע לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשהתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. הצגת קובצי יומן תאפשר לך לקבל מידע על רכיבי המערכת. לדוגמה: מעבד (CPU), זיכרון, דיסק, טעינה, תהליכים וכו', לפני ואחרי קבלת המצב הכושל. כך אפשר גם לזהות ולאבחן את המקור של בעיות המערכת הנוכחיות, או לחזות את הבעיות הפוטנציאליות במערכת.

לדוגמה, יומן מערכת אופייני של רכיב מכיל את הערכים הבאים:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml כדי לשלוט במנגנון הרישום ביומן בלי להפעיל מחדש שרת. הקובץ Logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום בודק את הקובץ Logback.xml לצורך זיהוי שינויים בהגדרה:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק אם יש שינויים מדי דקה. אם משמיטים את יחידות הזמן מהמאפיין scanPeriod, ברירת המחדל שלו היא אלפיות השנייה.

בטבלה הבאה מצוין המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.

רכיבים מיקום

שרת ניהול

opt/apigee/var/log/edge-management-server

נתב

opt/apigee/var/log/edge-router

מעבד בקשות

opt/apigee/var/log/edge-message-processor

שרת Qpid

opt/apigee/var/log/edge-qpid-server

שרת Apigee Postgres

opt/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

קסנדרה

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

מסד נתונים PostgreSQL

opt/apigee/var/log/apigee-postgresql

הפעלה של יומני ניפוי באגים עבור מעבד ההודעות וממשק המשתמש של Edge

כדי להפעיל יומני ניפוי באגים עבור מעבד ההודעות:

  1. בצומת של מעבד ההודעות, עורכים את /opt/apigee/customer/application/messsage-processor.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים לקובץ את המאפיין הבא:
    conf_system_log.level=DEBUG
  3. מפעילים מחדש את מעבד ההודעות:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:

  1. בצומת ממשק המשתמש של Edge, עורכים את /opt/apigee/customer/application/ui.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים לקובץ את המאפיין הבא:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

כלי מעקב

כלי מעקב כמו Nagios , Collectd , Graphite , Splunk , Sumologic ו-Monit יכולים לעזור לכם לעקוב אחר כל הסביבה הארגונית והתהליכים העסקיים.

רכיב נאגיוס נאספו Splunk

בדיקות ברמת המערכת

ניצול המעבד (CPU)

זיכרון פנוי/משומש

ניצול נפח האחסון

סטטיסטיקות רשת

תהליכים

בדיקות API

JMX

Java

קובצי יומן

אירועים קריטיים

הגעת למגבלת הקצב של יצירת הבקשות

לא ניתן לגשת לשרת הקצה העורפי (Hybris או SharePoint)

לא ניתן להגיע אל ה-FaaS (STS)

אירועי אזהרה

לא ניתן להתחבר לשרת ה-SMTP

הסכמי רמת שירות שהופרו