מעקב אחרי התראות
Apigee Edge מאפשר להעביר התראות ל-syslogs או למערכות/כלים חיצוניים למעקב כשמתרחשת שגיאה או כשל בגלל כשל באירוע. ההתראות האלה יכולות להיות התראות/אירועים ברמת המערכת או ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות בהתאמה אישית שנוצרות על סמך אירועים שנוצרו. בדרך כלל, האדמין של הרשת מגדיר את התנאים המותאמים אישית. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.
הגדרת ערכי סף לקבלת התראות
מגדירים סף שבו צריכה להופיע התראה. ההגדרה תלויה בהגדרת החומרה. צריך להגדיר את הסף בהתאם לקיבולת שלכם. לדוגמה, יכול להיות ש-Apigee Edge לא יתאים לכם אם יש לכם רק קיבולת של 6GB. אפשר להקצות ערך סף עם קריטריון של שווה ל-(=) או גדול מ-(>). אפשר גם לציין מרווח זמן בין שתי התראות רצופות. אפשר להשתמש באפשרות 'שעות/דקות/שניות'.
קריטריונים להגדרת התראות ברמת המערכת
בטבלה הבאה מתוארים הקריטריונים:
התרעה | ערך הסף המוצע | תיאור |
---|---|---|
נפח זיכרון נמוך |
500MB |
אין מספיק זיכרון כדי להפעיל רכיב |
נפח האחסון בדיסק נמוך (/var/log) |
8GB |
נפח האחסון בכונן קטן מדי. |
עומס גבוה |
3+ |
מספר התהליכים שממתינים להרצה גדל באופן בלתי צפוי |
התהליך הופסק |
N/A, ערך בוליאני של true או false |
תהליך Java של Apigee במערכת הופסק |
בדיקה של יציאות ספציפיות ל-Apigee ויציאות של צד שלישי
עוקבים אחרי היציאות הבאות כדי לוודא שהן פעילות
- יציאות 4526, 4527 ו-4528 בשרת הניהול, בנתב ובמעבד ההודעות
- יציאות 1099, 1100 ו-1101 בשרת הניהול, בנתב ובמעבד ההודעות
- יציאות 8081 ו-15999 בנתבים
- יציאות 8082 ו-8998 במעבדי בקשות
- יציאה 8080 בשרת הניהול
בודקים את יציאות הצד השלישי הבאות כדי לוודא שהן פעילות:
- יציאת Qpid 5672
- יציאה 5432 של Postgres
- יציאות של Cassandra: 7000, 7199, 9042, 9160
- יציאת ZooKeeper 2181
- יציאת OpenLDAP 10389
כדי לקבוע באיזה יציאה כל רכיב של Apigee מקשיב לקריאות API, צריך להפעיל את קריאות ה-API הבאות לשרת הניהול (בדרך כלל ביציאה 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
הפלט של הפקודות האלה יכלול קטעים שדומים לקטעים שמוצגים בהמשך. בקטע http.management.port
מצוין מספר היציאה של הרכיב שצוין.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
הצגת יומנים
קובצי יומן עוקבים אחרי הודעות לגבי האירוע או הפעולה של המערכת. הודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחשת שגיאה. הצגת קובצי יומנים מאפשרת לקבל מידע על רכיבי המערכת, למשל מעבד (CPU), זיכרון, דיסק, עומס, תהליכים וכו', לפני ואחרי הגעה למצב 'כשל'. כך תוכלו גם לזהות ולנתח את המקור לבעיות קיימות במערכת, או לחזות בעיות פוטנציאליות במערכת.
לדוגמה, יומן מערכת טיפוסי של רכיב מכיל את הרשומות הבאות, כפי שמוצג בהמשך:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml
כדי לשלוט במנגנון הרישום ביומן בלי להפעיל מחדש את השרת. קובץ logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום ביומן בודק את קובץ logback.xml כדי לזהות שינויים בתצורה:
<configuration scan="true" scanPeriod="30 seconds" >
כברירת מחדל, מנגנון הרישום ביומן בודק אם יש שינויים בכל דקה. אם משמיטים את יחידות הזמן במאפיין scanPeriod
, ברירת המחדל היא אלפיות שנייה.
בטבלה הבאה מפורט המיקום של קובצי היומנים של רכיבי Apigee Edge Private Cloud.
רכיבים | מיקום |
---|---|
שרת ניהול |
|
נתב |
|
מעבד בקשות |
|
שרת Qpid |
|
שרת Postgres של Apigee |
|
ממשק המשתמש של Edge |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
מסד נתונים של PostgreSQL |
|
הפעלת יומני ניפוי באגים למעבד ההודעות ולממשק המשתמש של Edge
כדי להפעיל יומני ניפוי באגים לעיבוד הודעות:
- עורכים את הערך של
/opt/apigee/customer/application/messsage-processor.properties
בצומת Message Processor. אם הקובץ לא קיים, יוצרים אותו. - מוסיפים לקובץ את המאפיין הבא:
conf_system_log.level=DEBUG
- מפעילים מחדש את מעבד ההודעות:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
כדי להפעיל יומני ניפוי באגים לממשק המשתמש של Edge:
- עורכים את
/opt/apigee/customer/application/ui.properties
בצומת של ממשק המשתמש של Edge. אם הקובץ הזה לא קיים, יוצרים אותו. - מוסיפים לקובץ את המאפיין הבא:
conf_application_logger.application=DEBUG
- מפעילים מחדש את ממשק המשתמש של Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
שיטות מומלצות ל-apigee-monit
כשמשתמשים ב-apigee-monit
, מומלץ ב-Apigee:
- להפסיק את המעקב אחרי רכיב לפני שמבצעים פעולה שמפעילה או מפסיקת אותו, כמו גיבוי או שדרוג.
- עוקבים אחרי
apigee-monit
באמצעות כלי כמוcron
. למידע נוסף, ראו מעקב אחרי apigee-monit.
כלים למעקב
כלים למעקב כמו Nagios, Collectd, Graphite, Splunk, Sumologic ו-Monit יכולים לעזור לכם לעקוב אחרי כל הסביבה הארגונית והתהליכים העסקיים.
רכיב | Nagios | Collectd | Splunk | |
---|---|---|---|---|
בדיקות ברמת המערכת |
ניצול המעבד |
|||
זיכרון פנוי/בשימוש |
||||
ניצול שטח האחסון |
||||
סטטיסטיקות רשת |
||||
תהליכים |
|
|
||
בדיקות API |
||||
JMX |
||||
Java |
||||
קובצי יומן |
||||
אירועים קריטיים |
אירוע של הגבלת קצב |
|||
לא ניתן לגשת לשרת הקצה העורפי (Hybris או SharePoint) |
||||
לא ניתן להגיע ל-FaaS (STS) |
||||
אירועי אזהרה |
לא ניתן להתחבר לשרת ה-SMTP |
|||
הפרות של הסכמי רמת שירות |