מעקב אחרי התראות
Apigee Edge מאפשרת לך להעביר התראות ל-Syslogs או למערכות/כלים חיצוניים לניטור כאשר שגיאה או שגיאה שקרו בגלל כשל באירוע. ההתראות יכולות להיות ברמת המערכת התראות/אירועים ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית נוצר על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים וההגבלות. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.
הגדרת ערכי סף לקבלת התראות
מגדירים סף שבו צריכה להופיע התראה. מה שתקבע תלוי תצורת חומרה. יש להגדיר סף ביחס לקיבולת. לדוגמה, Apigee אם יש לכם רק 6GB, יכול להיות ש-Edge נמוך מדי. אפשר להקצות ערך סף עם קריטריון של שווה ל-(=) או גדול מ-(>). ניתן גם לציין מרווח זמן בין שתי פעימות עוקבות יצירת התראות. אפשר להשתמש באפשרות 'שעות', 'דקות' או 'שניות'.
קריטריונים להגדרת התראות ברמת המערכת
הטבלה הבאה מתארת את הקריטריונים:
התרעה | ערך הסף המוצע | תיאור |
---|---|---|
נפח זיכרון נמוך |
500MB |
אין מספיק זיכרון פנוי כדי להפעיל רכיב |
אין מספיק מקום בכונן (/var/log) |
8GB |
נפח האחסון בדיסק נמוך מדי. |
עומס גבוה |
3+ |
תהליכים שממתינים להפעלה עלו באופן בלתי צפוי |
התהליך הופסק |
לא רלוונטי, ערך בוליאני של true או false |
תהליך Apigee Java במערכת הופסק |
בדיקה אם ספציפיים ל-Apigee או של צד שלישי יציאות
יש לבדוק את היציאות הבאות כדי לוודא שהן פעילות
- יציאות 4526, 4527 ו-4528 בשרת הניהול, בנתב ובמעבד ההודעות
- יציאות 1099, 1100 ו-1101 בשרת הניהול, בנתב ובמעבד ההודעות
- יציאות 8081 ו-15999 בנתבים
- יציאה 8082 ו-8998 במעבדי הודעות
- יציאה 8080 בשרת הניהול
בודקים את היציאות הבאות של צד שלישי כדי לוודא שהן פעילות:
- יציאת Qpid 5672
- יציאת Postgres 5432
- יציאות של Cassandra: 7000, 7199, 9042, 9160
- יציאתzoKeeper 2181
- יציאה 10389 של OpenLDAP
כדי לקבוע באיזה יציאה כל רכיב של Apigee מקשיב לקריאות API, צריך להפעיל את קריאות ה-API הבאות לשרת הניהול (בדרך כלל ביציאה 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
הפלט של הפקודות האלה יכיל קטעים שדומים לזה שמוצג בהמשך. בקטע http.management.port
מצוין מספר היציאה של הרכיב שצוין.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
צפייה ביומנים
קובצי יומן עוקבים אחר הודעות בנוגע לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. על ידי הצגת היומן קבצים, אפשר להשיג מידע על רכיבי מערכת, לדוגמה, מעבד (CPU), זיכרון, דיסק, טעינה, וכו', לפני ואחרי שמשיגים מצב של כשל. כך אפשר גם לזהות לאבחן את המקור של בעיות קיימות במערכת או לעזור לחזות את המערכת או בעיות.
לדוגמה, יומן מערכת אופייני של רכיב מכיל את הרשומות הבאות:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml
כדי לשלוט במנגנון הרישום ביומן בלי
שצריך להפעיל מחדש שרת. הקובץ Logback.xml מכיל את המאפיין הבא שמגדיר את
התדירות שבה מנגנון הרישום ביומן בודק את קובץ ה-logback.xml כדי לאתר שינויים בהגדרות:
<configuration scan="true" scanPeriod="30 seconds" >
כברירת מחדל, מנגנון הרישום ביומן בודק מדי דקה אם יש שינויים. אם משמיטים את יחידות הזמן
למאפיין scanPeriod
, ברירת המחדל היא אלפיות השנייה.
הטבלה הבאה מציינת את המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.
רכיבים | מיקום |
---|---|
שרת ניהול |
|
נתב |
|
מעבד בקשות |
|
שרת Qpid |
|
שרת Apigee Postgres |
|
ממשק המשתמש של Edge |
|
ZooKeeper |
|
OpenLDAP |
|
קסנדרה |
|
Qpidd |
|
מסד נתונים של PostgreSQL |
|
הפעלת יומני ניפוי באגים עבור ההודעה מעבד ו-Edge
כדי להפעיל יומני ניפוי באגים למעבד ההודעות:
- בצומת מעבד ההודעות, עורכים
/opt/apigee/customer/application/messsage-processor.properties
אם הקובץ הזה לא קיים, צור אותו. - מוסיפים את המאפיין הבא לקובץ:
conf_system_log.level=DEBUG
- מפעילים מחדש את מעבד ההודעות:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:
- בצומת ממשק המשתמש של Edge, עורכים את
/opt/apigee/customer/application/ui.properties
. אם הקובץ לא קיים, יוצרים אותו. - מוסיפים את המאפיין הבא לקובץ:
conf_application_logger.application=DEBUG
- מפעילים מחדש את ממשק המשתמש של Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
שיטות מומלצות ב-apigee-monit
כשמשתמשים ב-apigee-monit
, Apigee ממליצה:
- להפסיק את המעקב אחרי רכיב לפני שמבצעים פעולה שמפעילה או מפסיקת אותו, כמו גיבוי או שדרוג.
- אפשר לעקוב אחר
apigee-monit
באמצעות כלי כמוcron
. לקבלת מידע נוסף למידע נוסף, ראו מעקב אחר apigee-monit.
כלי מעקב
כלים למעקב כמו Nagios, Collectd, Graphite, Splunk, Sumologic ו-Monit יכולים לעזור לכם לעקוב אחרי כל הסביבה הארגונית ותהליכי העסק.
רכיב | Nagios | נאספו | ספלונק | |
---|---|---|---|---|
בדיקות ברמת המערכת |
ניצול המעבד |
|||
זיכרון פנוי/משומש |
||||
ניצול נפח הדיסק |
||||
סטטיסטיקות רשת |
||||
תהליכים |
|
|
||
בדיקות API |
||||
JMX |
||||
Java |
||||
קובצי יומן |
||||
אירועים קריטיים |
אירוע של הגבלת קצב |
|||
לא ניתן להגיע לשרת העורפי (Hybris או SharePoint) |
||||
לא ניתן להגיע אל FaaS (STS) |
||||
אירועי אזהרה |
לא ניתן לגשת לשרת ה-SMTP |
|||
הפרות של הסכמי רמת שירות |