أفضل الممارسات المتعلّقة بالمراقبة

تنبيهات المراقبة

تتيح لك Apigee Edge إعادة توجيه التنبيهات إلى سجلات النظام أو أدوات/أنظمة المراقبة الخارجية عند حدوث خطأ أو عطل بسبب تعذُّر تنفيذ حدث. يمكن أن تكون هذه التنبيهات على مستوى النظام أو على مستوى التطبيق. تكون تنبيهات مستوى التطبيق في معظمها تنبيهات مخصّصة يتم إنشاؤها استنادًا إلى الأحداث التي يتم إنشاؤها. يضبط مشرف الشبكة عادةً الشروط المخصّصة. لمزيد من المعلومات حول التنبيهات، يُرجى التواصل مع فريق الدعم في Apigee.

ضبط حدود التنبيه

اضبط حدًا أدنى يجب بعده إنشاء تنبيه. يعتمد ما تحدّده على إعدادات الأجهزة. يجب ضبط الحدّ الأدنى بما يتناسب مع سعتك. على سبيل المثال، قد تكون سعة Apigee Edge منخفضة جدًا إذا كانت لديك سعة 6 غيغابايت فقط. يمكنك تحديد الحدّ باستخدام معيار يساوي (=) أو أكبر من (>). يمكنك أيضًا تحديد فاصل زمني بين تنبيهَين متتاليَين. يمكنك استخدام خيار الساعات/الدقائق/الثواني.

معايير ضبط التنبيهات على مستوى النظام

يوضّح الجدول التالي المعايير:

تنبيه الحدّ المقترَح الوصف

الذاكرة منخفضة

‫500 ميغابايت

الذاكرة منخفضة جدًا بحيث لا يمكن بدء أحد المكوّنات

مساحة القرص منخفضة (/var/log)

‫8 غيغابايت

انخفضت مساحة القرص بشكل كبير.

التحميل العالي

3+

زيادة غير متوقّعة في عدد العمليات التي تنتظر التنفيذ

توقّفت العملية

غير متوفّر، قيمة منطقية صحيحة أو خاطئة

توقّفت عملية Apigee Java في النظام

التحقّق من المنافذ الخاصة بـ Apigee والمنافذ التابعة لجهات خارجية

راقِب المنافذ التالية للتأكّد من أنّها نشطة

  • المنافذ 4526 و4527 و4528 على خادم الإدارة وجهاز التوجيه ومعالج الرسائل
  • المنفذ 1099 و1100 و1101 على خادم الإدارة وجهاز التوجيه ومعالج الرسائل
  • المنفذان 8081 و15999 على أجهزة التوجيه
  • المنفذان 8082 و8998 على "معالجات الرسائل"
  • المنفذ 8080 على خادم الإدارة

تحقَّق من منافذ الجهات الخارجية التالية للتأكّد من أنّها نشطة:

  • منفذ Qpid 5672
  • منفذ Postgres 5432
  • منفذ Cassandra 7000 و7199 و9042 و9160
  • المنفذ 2181 في ZooKeeper
  • SymasLDAP port 10389

لتحديد المنفذ الذي يستمع إليه كل مكوّن من مكوّنات Apigee لطلبات البيانات من واجهة برمجة التطبيقات، أرسِل طلبات البيانات التالية من واجهة برمجة التطبيقات إلى خادم الإدارة (الذي يكون عادةً على المنفذ 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

سيتضمّن ناتج هذه الأوامر أقسامًا مشابهة لتلك الموضّحة أدناه. يقدّم القسم http.management.port رقم المنفذ للمكوّن المحدّد.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

عرض السجلات

تتتبّع ملفات السجلّ الرسائل المتعلقة بحدث/عملية النظام. تظهر الرسائل في السجلّ عند بدء العمليات واكتمالها أو عند حدوث حالة خطأ. من خلال عرض ملفات السجلّ، يمكنك الحصول على معلومات حول مكونات النظام، مثل وحدة المعالجة المركزية والذاكرة والقرص والحِمل والعمليات وما إلى ذلك، قبل وبعد الوصول إلى حالة تعذُّر. يتيح لك ذلك أيضًا تحديد مصدر المشاكل الحالية في النظام وتشخيصها أو يساعدك في توقّع المشاكل المحتملة في النظام.

على سبيل المثال، يحتوي سجلّ النظام النموذجي لأحد المكوّنات على الإدخالات التالية كما هو موضّح أدناه:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

يمكنك تعديل ملف /opt/apigee/conf/logback.xml للتحكّم في آلية تسجيل البيانات بدون الحاجة إلى إعادة تشغيل الخادم. يحتوي ملف logback.xml على السمة التالية التي تحدّد معدّل تكرار آلية التسجيل التي تتحقّق من ملف logback.xml بحثًا عن تغييرات في الإعدادات:

<configuration scan="true" scanPeriod="30 seconds" >

بشكلٍ تلقائي، تتحقّق آلية التسجيل من التغييرات كل دقيقة. في حال عدم تضمين وحدات الوقت في السمة scanPeriod، سيتم ضبطها تلقائيًا على الملّي ثانية.

يوضّح الجدول التالي موقع ملفات السجلّ لمكوّنات Apigee Edge Private Cloud.

المكونات الموقع الجغرافي

خادم الإدارة

opt/apigee/var/log/edge-management-server

جهاز التوجيه

opt/apigee/var/log/edge-router

معالج الرسائل

opt/apigee/var/log/edge-message-processor

خادم Qpid

opt/apigee/var/log/edge-qpid-server

خادم Apigee Postgres

opt/apigee/var/log/edge-postgres-server

واجهة مستخدم Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

SymasLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

قاعدة بيانات PostgreSQL

opt/apigee/var/log/apigee-postgresql

تفعيل سجلّات تصحيح الأخطاء الخاصة بـ "معالج الرسائل" وواجهة مستخدم Edge

لتفعيل سجلّات تصحيح الأخطاء في "معالج الرسائل"، اتّبِع الخطوات التالية:

  1. في عقدة "معالج الرسائل"، عدِّل /opt/apigee/customer/application/message-processor.properties. إذا لم يكن هذا الملف متوفّرًا، أنشئه.
  2. أضِف السمة التالية إلى الملف:
    conf_system_log.level=DEBUG
  3. أعِد تشغيل "معالج الرسائل" باتّباع الخطوات التالية:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

لتفعيل سجلّات تصحيح الأخطاء لواجهة مستخدم Edge، اتّبِع الخطوات التالية:

  1. في عقدة Edge UI، عدِّل /opt/apigee/customer/application/ui.properties. إذا لم يكن هذا الملف متوفّرًا، أنشئه.
  2. أضِف السمة التالية إلى الملف:
    conf_application_logger.application=DEBUG
  3. أعِد تشغيل واجهة مستخدم Edge باتّباع الخطوات التالية:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

أفضل ممارسات apigee-monit

عند استخدام apigee-monit، تنصح Apigee بما يلي:

أدوات المراقبة

يمكن أن تساعدك أدوات المراقبة، مثل Nagios وCollectd وGraphite وSplunk وSumologic وMonit، في مراقبة بيئة مؤسستك وعملياتها التجارية بالكامل.

المكوّن Nagios Collectd Splunk

عمليات التحقّق على مستوى النظام

استخدام وحدة المعالجة المركزية

الذاكرة الفارغة/المستخدَمة

استخدام مساحة القرص

إحصاءات الشبكة

العمليات

عمليات التحقّق من واجهة برمجة التطبيقات

JMX

Java

ملفات السجلّ

الأحداث الحرجة

تم بلوغ الحدّ الأقصى لمعدّل الاستخدام

يتعذّر الوصول إلى خادم الخلفية (Hybris أو SharePoint)

يتعذّر الوصول إلى FaaS (STS)

أحداث التحذير

يتعذّر الوصول إلى خادم SMTP

اتفاقيات مستوى الخدمة التي تم انتهاكها