أفضل الممارسات المراقَبة

الإصدار 4.19.01 من Edge for Private Cloud

مراقبة التنبيهات

تسمح لك Apigee Edge بإعادة توجيه التنبيهات إلى سجلات النظام أو أنظمة/أدوات المراقبة الخارجية عند يحدث الخطأ أو الإخفاق بسبب إخفاق حدث. ويمكن أن تكون هذه التنبيهات على مستوى النظام التنبيهات/الأحداث على مستوى التطبيقات. والتنبيهات على مستوى التطبيق هي في الغالب تنبيهات مخصصة يتم إنشاؤها استنادًا إلى الأحداث التي تم إنشاؤها. يضبط مشرف الشبكة عادةً إعدادات الظروف. للحصول على مزيد من المعلومات عن التنبيهات، يُرجى التواصل مع فريق دعم Apigee.

إعداد حدود للتنبيهات

اضبط الحد الأدنى الذي يجب إنشاء تنبيه بعده. يعتمد ما تقوم بتعيينه على تهيئة الأجهزة. يجب ضبط الحدّ حسب السعة المخصّصة لك. على سبيل المثال، Apigee قد تكون مساحة Edge منخفضة جدًا إذا كانت سعة التخزين لديك 6 غيغابايت فقط. يمكنك ضبط حدّ أقصى يساوي (=). أو أكبر من (>). كما يمكنك تحديد فاصل زمني بين اثنين متتاليين إنشاء التنبيهات. يمكنك استخدام خيار الساعات/الدقائق/الثواني.

معايير تعيين التنبيهات على مستوى النظام

ويوضّح الجدول التالي المعايير:

تنبيه الحدّ الأدنى المقترَح الوصف

ذاكرة منخفضة

500 ميغابايت

الذاكرة منخفضة جدًا بحيث لا يمكن بدء تشغيل مكوّن

انخفاض مساحة القرص (/var/log)

8 غيغابايت

انخفضت مساحة القرص كثيرًا.

حِمل زائد

3+

زيادة غير متوقعة في عدد العمليات التي تكون في انتظار التشغيل

تم إيقاف العملية

لا ينطبق، قيمة منطقية صواب أم خطأ

توقفت عملية Apigee Java في النظام

التحقق من البيانات الخاصة بـ Apigee والجهات الخارجية المنافذ

مراقبة المنافذ التالية للتأكد من أنها نشطة

  • المنافذ 4526 و4527 و4528 على خادم الإدارة وجهاز التوجيه ومعالج الرسائل
  • المنافذ 1099 و1100 و1101 على خادم الإدارة وجهاز التوجيه ومعالج الرسائل
  • المنفذان 8081 و15999 على أجهزة التوجيه
  • المنفذان 8082 و8998 في معالِجات معالجة الرسائل
  • المنفذ 8080 على خادم الإدارة

يُرجى الاطّلاع على المنافذ التالية التابعة لجهات خارجية للتأكّد من أنّها نشطة:

  • منفذ Qpid رقم 5672
  • المنفذ 5432 لـ Postgres
  • كاساندرا بورت 7000، 7199، 9042، 9160
  • منفذ ZooKeeper 2181
  • منفذ OpenLDAP 10389

لتحديد المنفذ الذي ينتظر كل مكون من مكونات Apigee استقبال طلبات البيانات من واجهة برمجة التطبيقات، حدثت مشكلة طلبات البيانات من واجهة برمجة التطبيقات التالية إلى خادم الإدارة (الذي يوجد عمومًا على المنفذ 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

وستتضمّن نتائج هذه الأوامر أقسامًا مشابهة لتلك الموضّحة أدناه. تشير رسالة الأشكال البيانية يقدّم القسم http.management.port رقم المنفذ للمكوّن المحدّد.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

عرض السجلات

تتبع ملفات السجل الرسائل المتعلقة بحدث/عملية النظام. تظهر الرسائل في السجل عند بدء العمليات واكتمالها أو عند حدوث شرط لخطأ. من خلال عرض السجلّ يمكنك الحصول على معلومات حول مكونات النظام، على سبيل المثال، وحدة المعالجة المركزية (CPU) والذاكرة والقرص والتحميل والعمليات، وما إلى ذلك، قبل وبعد الوصول إلى حالة الفشل. يسمح لك هذا أيضًا بتحديد تشخيص مصدر مشكلات النظام الحالية أو مساعدتك في التنبؤ بالنظام المحتمل المشكلات.

على سبيل المثال، يحتوي سجل النظام النموذجي لأحد المكونات على الإدخالات التالية كما هو موضح أدناه:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

يمكنك تعديل ملف /opt/apigee/conf/logback.xml للتحكم في آلية التسجيل دون الاضطرار إلى إعادة تشغيل خادم. يحتوي ملف Logback.xml على السمة التالية التي تحدّد معدّل تكرار تحقّق آلية التسجيل من ملف Logback.xml بحثًا عن تغييرات في الإعدادات:

<configuration scan="true" scanPeriod="30 seconds" >

بشكل افتراضي، تتحقق آلية التسجيل من التغييرات كل دقيقة. إذا حذفت الوحدات الزمنية إلى السمة scanPeriod، يتم ضبطها تلقائيًا على المللي ثانية.

يوضّح الجدول التالي موقع ملفات السجلّ لمكونات Apigee Edge Private Cloud.

المكونات الموقع الجغرافي

خادم الإدارة

opt/apigee/var/log/edge-management-server

جهاز التوجيه

opt/apigee/var/log/edge-router

معالج الرسائل

opt/apigee/var/log/edge-message-processor

خادم Qpid

opt/apigee/var/log/edge-qpid-server

خادم Apigee Postgres

opt/apigee/var/log/edge-postgres-server

واجهة مستخدم Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

كاساندرا

opt/apigee/var/log/apigee-cassandra

لوحة مفاتيح Qpidd

opt/apigee/var/log/apigee-qpidd

قاعدة بيانات PostgreSQL

opt/apigee/var/log/apigee-postgresql

تفعيل سجلات تصحيح الأخطاء للرسالة المعالِج وواجهة مستخدم Edge

لتفعيل سجلات تصحيح الأخطاء لمعالج الرسائل:

  1. في عقدة "معالج الرسائل"، عدِّل /opt/apigee/customer/application/messsage-processor.properties إذا كان هذا الملف لا غير موجود، قم بإنشائها.
  2. أضِف السمة التالية إلى الملف:
    conf_system_log.level=DEBUG
  3. إعادة تشغيل معالج الرسائل:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

لتفعيل سجلات تصحيح الأخطاء لواجهة مستخدم Edge:

  1. في عقدة واجهة مستخدم Edge، عدِّل /opt/apigee/customer/application/ui.properties. إذا لم يكن هذا الملف متوفّرًا، أنشئه.
  2. أضِف السمة التالية إلى الملف:
    conf_application_logger.application=DEBUG
  3. أعد تشغيل واجهة مستخدم Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

أفضل ممارسات نظام apigee-monit

عند استخدام "apigee-monit"، تنصحك Apigee بما يلي:

أدوات المراقبة

يمكن أن تساعدك أدوات المراقبة، مثل Nagios وCollectd وGraphite وSplunk وSumologic وMonit. مراقبة بيئة مؤسستك بالكامل وعملياتك التجارية.

المكوّن Nagios يتم جمعها Splunk

عمليات التحقّق على مستوى النظام

استخدام وحدة المعالجة المركزية (CPU)

الذاكرة المتوفّرة/المستعملة

استخدام مساحة القرص

إحصاءات الشبكة

العمليات

عمليات التحقّق من واجهة برمجة التطبيقات

JMX

Java

ملفات السجلّ

الأحداث المهمة

نتيجة قيود المعدل

لا يمكن الوصول إلى خادم الخلفية (Hybris أو SharePoint)

لا يمكن الوصول إلى FaaS (STS)

الأحداث التحذيرية

لا يمكن الوصول إلى خادم SMTP

تم انتهاك اتفاقيات مستوى الخدمة