שיטות מומלצות למעקב

Edge for Private Cloud גרסה 4.16.09

מעקב אחרי התראות

Apigee Edge מאפשרת לך להעביר התראות ל-Syslogs או למערכות/כלים חיצוניים לניטור כאשר שגיאה או שגיאה שקרו בגלל כשל באירוע. ההתראות יכולות להיות ברמת המערכת התראות/אירועים ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית נוצר על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים וההגבלות. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.

הגדרת ערכי סף לקבלת התראות

הגדרת סף שאחריו יש ליצור התראה. מה שתקבע תלוי תצורת חומרה. יש להגדיר סף ביחס לקיבולת. לדוגמה, Apigee אם יש לכם רק 6GB, יכול להיות ש-Edge נמוך מדי. ניתן להקצות סף עם שווה ל- (=) או גדול מהקריטריון (>). ניתן גם לציין מרווח זמן בין שתי פעימות עוקבות יצירת התראות. אפשר להשתמש באפשרות 'שעות', 'דקות' או 'שניות'.

קריטריונים להגדרת התראות ברמת המערכת

הטבלה הבאה מתארת את הקריטריונים:

התראה

הצעה לסף

תיאור

נפח זיכרון נמוך

500MB

הזיכרון נמוך מדי להפעלת רכיב

אין מספיק מקום בכונן (/var/log)

8GB

אין מספיק מקום בדיסק.

עומס גבוה

3+

תהליכים שממתינים להפעלה עלו באופן בלתי צפוי

התהליך הופסק

לא רלוונטי, ערך בוליאני של true או false

תהליך Apigee Java במערכת הופסק

בדיקה אם ספציפיים ל-Apigee או של צד שלישי יציאות

יש לבדוק את היציאות הבאות כדי לוודא שהן פעילות

  • יציאה 4526, 4527 ו-4528 בשרת ניהול, נתב ומעבד הודעות
  • יציאה 1099, 1100 ו-1101 בשרת ניהול, נתב ומעבד הודעות
  • יציאה 8081 ו-15999 בנתבים
  • יציאה 8082 ו-8998 במעבדי הודעות
  • יציאה 8080 ב-Management Server

בודקים את היציאות הבאות של צד שלישי כדי לוודא שהן פעילות:

  • יציאת Qpid 5672
  • יציאת Postgres 5432
  • Cassandra Port 7000, 7199, 9042, 9160
  • יציאתzoKeeper 2181
  • יציאה 10389 של OpenLDAP

כדי לקבוע באיזו יציאה כל רכיב של Apigee מאזין לקריאות ל-API, את קריאות ה-API הבאות לשרת הניהול (שבדרך כלל נמצא ביציאה 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכיל קטעים שדומים לזה שמוצג בהמשך. &quot;http.management.port&quot; קטע מחזירה את מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

צפייה ביומנים

קובצי יומן עוקבים אחר הודעות בנוגע לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. על ידי הצגת היומן קבצים, אפשר להשיג מידע על רכיבי מערכת, לדוגמה, מעבד (CPU), זיכרון, דיסק, טעינה, וכו', לפני ואחרי שמשיגים מצב של כשל. כך אפשר גם לזהות לאבחן את המקור של בעיות קיימות במערכת או לעזור לחזות את המערכת או בעיות.

לדוגמה, יומן מערכת אופייני של רכיב מכיל את הרשומות הבאות:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

אפשר לערוך את הקובץ /<inst_root>/apigee/conf/logback.xml כדי לשלוט ברישום ביומן ללא צורך בהפעלה מחדש של השרת. קובץ ה-logback.xml מכיל את הפרטים הבאים: מאפיין שקובע את התדירות שבה מנגנון הרישום ביומן בודק את קובץ ה-logback.xml שינויים בתצורה:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק מדי דקה אם יש שינויים. אם משמיטים את יחידות הזמן למאפיין scanPeriod, ברירת המחדל היא אלפיות השנייה.

הטבלה הבאה מציינת את המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.

רכיבים

מיקום

שרת ניהול

&lt;inst_root&gt;/apigee/var/log/edge-management-server

נתב

&lt;inst_root&gt;/apigee/var/log/edge-router

מעבד בקשות

&lt;inst_root&gt;/apigee/var/log/edge-message-processor

שרת Qpid

&lt;inst_root&gt;/apigee/var/log/edge-qpid-server

שרת Apigee Postgres

&lt;inst_root&gt;/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

&lt;inst_root&gt;/apigee/var/log/edge-ui

ZooKeeper

&lt;inst_root&gt;/apigee/var/log/apigee-zookeeper

OpenLDAP

&lt;inst_root&gt;/apigee/var/log/apigee-openldap

קסנדרה

&lt;inst_root&gt;/apigee/var/log/apigee-cassandra

קפיד

&lt;inst_root&gt;/apigee/var/log/apigee-qpidd

מסד נתונים של PostgreSQL

&lt;inst_root&gt;/apigee/var/log/apigee-postgresql

הפעלה של יומני ניפוי באגים להודעה ממשק המשתמש של המעבד ו-Edge

כדי להפעיל יומני ניפוי באגים למעבד ההודעות:

  1. בצומת מעבד ההודעות, עורכים את /&lt;install_dir&gt;/apigee/customer/application/messsage-processor.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_system_log.level=DEBUG
  3. צריך להפעיל מחדש את מעבד ההודעות:
    &gt; /<install_dir>/apigee/apigee-service/bin/apigee-service edge-message-processor הפעלה מחדש

כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:

  1. בצומת ממשק המשתמש של Edge, עורכים את /&lt;install_dir&gt;/apigee/customer/application/ui.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    &gt; /<install_dir>/apigee/apigee-service/bin/apigee-service dge-ui מחדש

כלי מעקב

כלי המעקב בקוד פתוח כגון Nagios , Collectd , Graphite , Splunk , Sumologic ו- Monit יכולה לעזור לכם לעקוב אחרי כל סביבת הארגון והתהליכים העסקיים שלכם.

רכיב

Nagios

נאספו

Splunk

בדיקות ברמת המערכת

ניצול המעבד (CPU)

?

?

זיכרון פנוי/משומש

?

?

ניצול נפח הדיסק

?

?

סטטיסטיקות רשת

?

?

תהליכים

?

בדיקות API

?

JMX

?

Java

?

קובצי יומן

?

אירועים קריטיים

הגעה למגבלת הקצב של יצירת בקשות

?

לא ניתן להגיע לשרת העורפי (Hybris או SharePoint)

?

לא ניתן להגיע אל FaaS (STS)

?

אירועי אזהרה

לא ניתן לגשת לשרת ה-SMTP

?

הופר לגבי הסכם רמת השירות

?