שיטות מומלצות למעקב

מעקב אחרי התראות

Apigee Edge מאפשרת לך להעביר התראות ל-Syslogs או למערכות/כלים חיצוניים לניטור כאשר שגיאה או שגיאה שקרו בגלל כשל באירוע. ההתראות יכולות להיות ברמת המערכת התראות/אירועים ברמת האפליקציה. התראות ברמת האפליקציה הן בעיקר התראות מותאמות אישית נוצר על סמך אירועים שנוצרו. בדרך כלל מנהל הרשת מגדיר את התנאים וההגבלות. למידע נוסף על התראות, אפשר לפנות לתמיכה של Apigee.

הגדרת ערכי סף לקבלת התראות

הגדרת סף שאחריו יש ליצור התראה. מה שתקבע תלוי תצורת חומרה. יש להגדיר סף ביחס לקיבולת. לדוגמה, Apigee אם יש לכם רק 6GB, יכול להיות ש-Edge נמוך מדי. ניתן להקצות סף עם שווה ל- (=) או גדול מהקריטריון (>). ניתן גם לציין מרווח זמן בין שתי פעימות עוקבות יצירת התראות. אפשר להשתמש באפשרות 'שעות', 'דקות' או 'שניות'.

קריטריונים להגדרת התראות ברמת המערכת

הטבלה הבאה מתארת את הקריטריונים:

התרעה הסף המוצע תיאור

נפח זיכרון נמוך

500MB

אין מספיק זיכרון פנוי כדי להפעיל רכיב

אין מספיק מקום בכונן (/var/log)

8GB

אין מספיק מקום בדיסק.

עומס גבוה

3+

תהליכים שממתינים להפעלה עלו באופן בלתי צפוי

התהליך הופסק

לא רלוונטי, ערך בוליאני של true או false

תהליך Apigee Java במערכת הופסק

בדיקה אם ספציפיים ל-Apigee או של צד שלישי יציאות

יש לבדוק את היציאות הבאות כדי לוודא שהן פעילות

  • יציאה 4526, 4527 ו-4528 בשרת ניהול, נתב ומעבד הודעות
  • יציאה 1099, 1100 ו-1101 בשרת ניהול, נתב ומעבד הודעות
  • יציאה 8081 ו-15999 בנתבים
  • יציאה 8082 ו-8998 במעבדי הודעות
  • יציאה 8080 ב-Management Server

בודקים את היציאות הבאות של צד שלישי כדי לוודא שהן פעילות:

  • יציאת Qpid 5672
  • יציאת Postgres 5432
  • Cassandra Port 7000, 7199, 9042, 9160
  • יציאתzoKeeper 2181
  • יציאה 10389 של OpenLDAP

כדי לקבוע באיזו יציאה כל רכיב של Apigee מאזין לקריאות ל-API, את קריאות ה-API הבאות לשרת הניהול (שבדרך כלל נמצא ביציאה 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

הפלט של הפקודות האלה יכיל קטעים שדומים לזה שמוצג בהמשך. הקטע http.management.port מציג את מספר היציאה של הרכיב שצוין.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

צפייה ביומנים

קובצי יומן עוקבים אחר הודעות הקשורות לאירוע/פעולה של המערכת. ההודעות מופיעות ביומן כשתהליכים מתחילים ומסתיימים, או כשמתרחש תנאי שגיאה. על ידי הצגת היומן קבצים, אפשר להשיג מידע על רכיבי מערכת, לדוגמה, מעבד (CPU), זיכרון, דיסק, טעינה, וכו', לפני ואחרי שמשיגים מצב של כשל. כך אפשר גם לזהות לאבחן את המקור של בעיות קיימות במערכת או לעזור לחזות את המערכת או בעיות.

לדוגמה, יומן מערכת אופייני של רכיב מכיל את הרשומות הבאות:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

אפשר לערוך את הקובץ /opt/apigee/conf/logback.xml כדי לשלוט במנגנון הרישום ביומן בלי שצריך להפעיל מחדש שרת. הקובץ Logback.xml מכיל את המאפיין הבא שמגדיר את התדירות שבה מנגנון הרישום ביומן בודק את קובץ ה-logback.xml כדי לאתר שינויים בהגדרות:

<configuration scan="true" scanPeriod="30 seconds" >

כברירת מחדל, מנגנון הרישום ביומן בודק מדי דקה אם יש שינויים. אם משמיטים את יחידות הזמן למאפיין scanPeriod, ברירת המחדל היא אלפיות השנייה.

הטבלה הבאה מציינת את המיקום של קובצי היומן של רכיבי הענן הפרטי של Apigee Edge.

רכיבים מיקום

שרת ניהול

opt/apigee/var/log/edge-management-server

נתב

opt/apigee/var/log/edge-router

מעבד בקשות

opt/apigee/var/log/edge-message-processor

שרת Qpid

opt/apigee/var/log/edge-qpid-server

שרת Apigee Postgres

opt/apigee/var/log/edge-postgres-server

ממשק המשתמש של Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

קסנדרה

opt/apigee/var/log/apigee-cassandra

קפיד

opt/apigee/var/log/apigee-qpidd

מסד נתונים של PostgreSQL

opt/apigee/var/log/apigee-postgresql

הפעלת יומני ניפוי באגים עבור ההודעה מעבד ו-Edge

כדי להפעיל יומני ניפוי באגים עבור מעבד ההודעות:

  1. בצומת מעבד ההודעות, עורכים את /opt/apigee/customer/application/messsage-processor.properties אם הקובץ הזה לא קיים, צור אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_system_log.level=DEBUG
  3. מפעילים מחדש את מעבד ההודעות:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

כדי להפעיל יומני ניפוי באגים בממשק המשתמש של Edge:

  1. בצומת ממשק המשתמש של Edge, עורכים את /opt/apigee/customer/application/ui.properties. אם הקובץ לא קיים, יוצרים אותו.
  2. מוסיפים את המאפיין הבא לקובץ:
    conf_application_logger.application=DEBUG
  3. מפעילים מחדש את ממשק המשתמש של Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

שיטות מומלצות ב-apigee-monit

כשמשתמשים ב-apigee-monit, Apigee ממליצה:

כלי מעקב

ניתן להיעזר בכלי מעקב כגון Nagios , Collectd , Graphite , Splunk , Sumologic ו-Monit לעקוב אחרי כל הסביבה הארגונית והתהליכים העסקיים.

רכיב Nagios נאספו Splunk

בדיקות ברמת המערכת

ניצול המעבד (CPU)

זיכרון פנוי/משומש

ניצול נפח הדיסק

סטטיסטיקות רשת

תהליכים

בדיקות API

JMX

Java

קובצי יומן

אירועים קריטיים

הגעה למגבלת הקצב של יצירת בקשות

לא ניתן להגיע לשרת העורפי (Hybris או SharePoint)

לא ניתן להגיע אל FaaS (STS)

אירועי אזהרה

לא ניתן לגשת לשרת ה-SMTP

הסכמי רמת השירות הופרו