שיטות מומלצות למעקב

מעקב אחרי התראות

Apigee Edge מאפשרת לך להעביר התראות ל-Syslogs או למערכות/כלים חיצוניים לניטור כאשר שגיאה או שגיאה שקרו בגלל כשל באירוע. ההתראות יכולות להיות ברמת המערכת התראות/אירועים ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית נוצר על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים וההגבלות. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.

הגדרת ערכי סף לקבלת התראות

מגדירים סף שבו צריכה להופיע התראה. מה שתקבע תלוי תצורת חומרה. יש להגדיר סף ביחס לקיבולת. לדוגמה, Apigee אם יש לכם רק 6GB, יכול להיות ש-Edge נמוך מדי. אפשר להקצות ערך סף עם קריטריון של שווה ל-(=) או גדול מ-(>). ניתן גם לציין מרווח זמן בין שתי פעימות עוקבות יצירת התראות. אפשר להשתמש באפשרות 'שעות', 'דקות' או 'שניות'.

קריטריונים להגדרת התראות ברמת המערכת

הטבלה הבאה מתארת את הקריטריונים:

התרעה ערך הסף המוצע תיאור

נפח זיכרון נמוך

500MB

אין מספיק זיכרון פנוי כדי להפעיל רכיב

אין מספיק מקום בכונן (/var/log)

8GB

נפח האחסון בדיסק נמוך מדי.

עומס גבוה

3+

תהליכים שממתינים להפעלה עלו באופן בלתי צפוי

התהליך הופסק

לא רלוונטי, ערך בוליאני של true או false

תהליך Apigee Java במערכת הופסק

בדיקה אם ספציפיים ל-Apigee או של צד שלישי יציאות

יש לבדוק את היציאות הבאות כדי לוודא שהן פעילות

  • יציאות 4526,‏ 4527 ו-4528 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 1099,‏ 1100 ו-1101 בשרת הניהול, בנתב ובמעבד ההודעות
  • יציאות 8081 ו-15999 בנתבים
  • יציאה 8082 ו-8998 במעבדי הודעות
  • יציאה 8080 בשרת הניהול

בודקים את היציאות הבאות של צד שלישי כדי לוודא שהן פעילות:

  • יציאת Qpid 5672
  • יציאת Postgres 5432
  • יציאות של Cassandra: 7000, 7199, 9042, 9160
  • יציאתzoKeeper 2181
  • יציאה 10389 של OpenLDAP

כדי לקבוע באיזה יציאה כל רכיב של Apigee מקשיב לקריאות API, צריך להפעיל את קריאות ה-API הבאות לשרת הניהול (בדרך כלל ביציאה 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכיל קטעים שדומים לזה שמוצג בהמשך. בקטע http.management.port מצוין מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

צפייה ביומנים

קובצי יומן עוקבים אחר הודעות בנוגע לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. על ידי הצגת היומן קבצים, אפשר להשיג מידע על רכיבי מערכת, לדוגמה, מעבד (CPU), זיכרון, דיסק, טעינה, וכו', לפני ואחרי שמשיגים מצב של כשל. כך אפשר גם לזהות לאבחן את המקור של בעיות קיימות במערכת או לעזור לחזות את המערכת או בעיות.

לדוגמה, יומן מערכת אופייני של רכיב מכיל את הרשומות הבאות:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml כדי לשלוט במנגנון הרישום ביומן בלי שצריך להפעיל מחדש שרת. הקובץ Logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום ביומן בודק את קובץ ה-logback.xml כדי לאתר שינויים בהגדרות:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק מדי דקה אם יש שינויים. אם משמיטים את יחידות הזמן למאפיין scanPeriod, ברירת המחדל היא אלפיות השנייה.

הטבלה הבאה מציינת את המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.

רכיבים מיקום

שרת ניהול

opt/apigee/var/log/edge-management-server

נתב

opt/apigee/var/log/edge-router

מעבד בקשות

opt/apigee/var/log/edge-message-processor

שרת Qpid

opt/apigee/var/log/edge-qpid-server

שרת Apigee Postgres

opt/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

קסנדרה

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

מסד נתונים של PostgreSQL

opt/apigee/var/log/apigee-postgresql

הפעלת יומני ניפוי באגים עבור ההודעה מעבד ו-Edge

כדי להפעיל יומני ניפוי באגים למעבד ההודעות:

  1. בצומת מעבד ההודעות, עורכים /opt/apigee/customer/application/messsage-processor.properties אם הקובץ הזה לא קיים, צור אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_system_log.level=DEBUG
  3. מפעילים מחדש את מעבד ההודעות:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:

  1. בצומת ממשק המשתמש של Edge, עורכים את /opt/apigee/customer/application/ui.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

שיטות מומלצות ב-apigee-monit

כשמשתמשים ב-apigee-monit, Apigee ממליצה:

כלי מעקב

כלים למעקב כמו Nagios,‏ Collectd,‏ Graphite,‏ Splunk,‏ Sumologic ו-Monit יכולים לעזור לכם לעקוב אחרי כל הסביבה הארגונית ותהליכי העסק.

רכיב Nagios נאספו ספלונק

בדיקות ברמת המערכת

ניצול המעבד

זיכרון פנוי/משומש

ניצול נפח הדיסק

סטטיסטיקות רשת

תהליכים

בדיקות API

JMX

Java

קובצי יומן

אירועים קריטיים

אירוע של הגבלת קצב

לא ניתן להגיע לשרת העורפי (Hybris או SharePoint)

לא ניתן להגיע אל FaaS (STS)

אירועי אזהרה

לא ניתן לגשת לשרת ה-SMTP

הפרות של הסכמי רמת שירות