שיטות מומלצות למעקב

Edge for Private Cloud גרסה 4.17.09

מעקב אחרי התראות

Apigee Edge מאפשרת לך להעביר התראות ל-Syslogs או למערכות/כלים חיצוניים לניטור כאשר שגיאה או שגיאה שקרו בגלל כשל באירוע. ההתראות יכולות להיות ברמת המערכת התראות/אירועים ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית נוצר על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים וההגבלות. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.

הגדרת ערכי סף לקבלת התראות

הגדרת סף שאחריו יש ליצור התראה. מה שתקבע תלוי תצורת חומרה. יש להגדיר סף ביחס לקיבולת. לדוגמה, Apigee אם יש לכם רק 6GB, יכול להיות ש-Edge נמוך מדי. ניתן להקצות סף עם שווה ל- (=) או גדול מהקריטריון (>). ניתן גם לציין מרווח זמן בין שתי פעימות עוקבות יצירת התראות. אפשר להשתמש באפשרות 'שעות', 'דקות' או 'שניות'.

קריטריונים להגדרת התראות ברמת המערכת

הטבלה הבאה מתארת את הקריטריונים:

התראה

הצעה לסף

תיאור

נפח זיכרון נמוך

500MB

אין מספיק זיכרון פנוי כדי להפעיל רכיב

אין מספיק מקום בכונן (/var/log)

8GB

אין מספיק מקום בדיסק.

עומס גבוה

3+

תהליכים שממתינים להפעלה עלו באופן בלתי צפוי

התהליך הופסק

לא רלוונטי, ערך בוליאני של true או false

תהליך Apigee Java במערכת הופסק

בדיקה אם ספציפיים ל-Apigee או של צד שלישי יציאות

צריך לבדוק את היציאות הבאות כדי לוודא שהן פעילות

  • יציאה 4526, 4527 ו-4528 בשרת ניהול, נתב ומעבד הודעות
  • יציאה 1099, 1100 ו-1101 בשרת ניהול, נתב ומעבד הודעות
  • יציאה 8081 ו-15999 בנתבים
  • יציאה 8082 ו-8998 במעבדי הודעות
  • יציאה 8080 ב-Management Server

בודקים את היציאות הבאות של צד שלישי כדי לוודא שהן פעילות:

  • יציאת Qpid 5672
  • יציאת Postgres 5432
  • Cassandra Port 7000, 7199, 9042, 9160
  • יציאתzoKeeper 2181
  • יציאה 10389 של OpenLDAP

כדי לקבוע באיזו יציאה כל רכיב של Apigee מאזין לקריאות ל-API, את קריאות ה-API הבאות לשרת הניהול (שבדרך כלל נמצא ביציאה 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכיל קטעים שדומים לזה שמוצג בהמשך. &quot;http.management.port&quot; קטע מחזירה את מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

צפייה ביומנים

קובצי יומן עוקבים אחר הודעות הקשורות לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. על ידי הצגת היומן קבצים, אפשר להשיג מידע על רכיבי מערכת, לדוגמה, מעבד (CPU), זיכרון, דיסק, טעינה, וכו', לפני ואחרי שמשיגים מצב של כשל. כך אפשר גם לזהות לאבחן את המקור של בעיות קיימות במערכת או לעזור לחזות את המערכת או בעיות.

לדוגמה, יומן מערכת אופייני של רכיב מכיל את הרשומות הבאות:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

ניתן לערוך את הקובץ /opt/apigee/conf/logback.xml כדי לשלוט במנגנון הרישום ביומן מבלי שצריך להפעיל מחדש שרת. הקובץ Logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום ביומן בודק את קובץ ה-logback.xml כדי לאתר שינויים בהגדרות:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק מדי דקה אם יש שינויים. אם משמיטים את יחידות הזמן למאפיין scanPeriod, ברירת המחדל היא אלפיות השנייה.

הטבלה הבאה מציינת את המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.

רכיבים

מיקום

שרת ניהול

opt/apigee/var/log/edge-management-server

נתב

opt/apigee/var/log/edge-router

מעבד בקשות

opt/apigee/var/log/edge-message-processor

שרת Qpid

opt/apigee/var/log/edge-qpid-server

שרת Apigee Postgres

opt/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

קסנדרה

opt/apigee/var/log/apigee-cassandra

קפיד

opt/apigee/var/log/apigee-qpidd

מסד נתונים של PostgreSQL

opt/apigee/var/log/apigee-postgresql

הפעלת יומני ניפוי באגים עבור ההודעה מעבד ו-Edge

כדי להפעיל יומני ניפוי באגים עבור מעבד ההודעות:

  1. בצומת מעבד ההודעות, עורכים את /opt/apigee/customer/application/messsage-processor.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את התכונה הבאה לקובץ:
    conf_system_log.level=DEBUG
  3. צריך להפעיל מחדש את מעבד ההודעות:
    &gt; /opt/apigee/apigee-service/bin/apigee-service edge-message-processor הפעלה מחדש

כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:

  1. בצומת ממשק המשתמש של Edge, עורכים את /opt/apigee/customer/application/ui.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את התכונה הבאה לקובץ:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    &gt; /opt/apigee/apigee-service/bin/apigee-service edge-ui מחדש

כלי מעקב

ניתן להיעזר בכלי מעקב כגון Nagios , Collectd , Graphite , Splunk , Sumologic ו-Monit לעקוב אחרי כל הסביבה הארגונית והתהליכים העסקיים.

רכיב

Nagios

נאספו

Splunk

בדיקות ברמת המערכת

ניצול המעבד (CPU)

?

?

זיכרון פנוי/משומש

?

?

ניצול נפח הדיסק

?

?

סטטיסטיקות רשת

?

?

תהליכים

?

בדיקות API

?

JMX

?

Java

?

קובצי יומן

?

אירועים קריטיים

הגעה למגבלת הקצב של יצירת בקשות

?

לא ניתן להגיע לשרת העורפי (Hybris או SharePoint)

?

לא ניתן להגיע אל FaaS (STS)

?

אירועי אזהרה

לא ניתן לגשת לשרת ה-SMTP

?

הופר לגבי הסכם רמת השירות

?