أفضل الممارسات المتعلّقة بالتتبّع

Edge for Private Cloud، الإصدار 4.17.05

تنبيهات المراقبة

تسمح لك Apigee Edge بإعادة توجيه التنبيهات إلى سجلات النظام أو أنظمة/أدوات المراقبة الخارجية عند يحدث خطأ أو إخفاق بسبب إخفاق حدث. ويمكن أن تكون هذه التنبيهات على مستوى النظام التنبيهات/الأحداث على مستوى التطبيقات. والتنبيهات على مستوى التطبيق هي في الغالب تنبيهات مخصصة تم إنشاؤها استنادًا إلى الأحداث التي تم إنشاؤها. يضبط مشرف الشبكة عادةً إعدادات الظروف. للحصول على مزيد من المعلومات عن التنبيهات، يُرجى التواصل مع فريق دعم Apigee.

ضبط حدود التنبيه

اضبط الحد الأدنى الذي يجب إنشاء تنبيه بعده. يعتمد ما تقوم بتعيينه على تهيئة الأجهزة. يجب ضبط الحدّ حسب السعة المخصّصة لك. على سبيل المثال، Apigee قد تكون مساحة Edge منخفضة جدًا إذا كانت سعة التخزين لديك 6 غيغابايت فقط. يمكنك ضبط حدّ أقصى يساوي (=). أو أكبر من (>). كما يمكنك تحديد فاصل زمني بين اثنين متتاليين إنشاء التنبيهات. يمكنك استخدام خيار الساعات/الدقائق/الثواني.

معايير تعيين التنبيهات على مستوى النظام

ويوضّح الجدول التالي المعايير:

تنبيه

الحد الأدنى المقترَح

الوصف

ذاكرة منخفضة

500 ميغابايت

الذاكرة منخفضة جدًا بحيث لا يمكن بدء تشغيل مكوّن

انخفاض مساحة القرص (/var/log)

8 غيغابايت

انخفضت مساحة القرص كثيرًا.

حِمل زائد

3+

زيادة غير متوقعة في عدد العمليات التي تكون في انتظار التشغيل

تم إيقاف العملية

لا ينطبق، قيمة منطقية صواب أم خطأ

توقفت عملية Apigee Java في النظام

التحقق من البيانات الخاصة بـ Apigee والجهات الخارجية المنافذ

عليك مراقبة المنافذ التالية للتأكّد من أنّها نشطة.

  • المنافذ 4526 و4527 و4528 على خادم الإدارة وجهاز التوجيه ومعالج الرسائل
  • المنافذ 1099 و1100 و1101 على خادم الإدارة وجهاز التوجيه ومعالج الرسائل
  • المنفذان 8081 و15999 على أجهزة التوجيه
  • المنفذان 8082 و8998 في معالِجات معالجة الرسائل

المنفذ 8080 على خادم الإدارة تحقق من المنافذ التابعة لجهات خارجية التالية للتأكد إذا كانت نشطة:

  • منفذ Qpid رقم 5672
  • المنفذ 5432 لـ Postgres
  • كاساندرا بورت 7000، 7199، 9042، 9160
  • منفذ ZooKeeper 2181
  • منفذ OpenLDAP 10389

لتحديد المنفذ الذي ينتظر كل مكون من مكونات Apigee استقبال طلبات البيانات من واجهة برمجة التطبيقات، حدثت مشكلة طلبات البيانات من واجهة برمجة التطبيقات التالية إلى خادم الإدارة (الذي يوجد عمومًا على المنفذ 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

وستتضمّن نتائج هذه الأوامر أقسامًا مشابهة لتلك الموضّحة أدناه. تشير رسالة الأشكال البيانية &quot;http.management.port&quot; قسم يعطي رقم المنفذ للمكون المحدد.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

عرض السجلات

تتبع ملفات السجل الرسائل المتعلقة بحدث/عملية النظام. تظهر الرسائل في السجل عند بدء العمليات واكتمالها أو عند حدوث شرط لخطأ. من خلال عرض السجلّ يمكنك الحصول على معلومات حول مكونات النظام، على سبيل المثال، وحدة المعالجة المركزية (CPU) والذاكرة والقرص والتحميل والعمليات، وما إلى ذلك، قبل وبعد الوصول إلى حالة الفشل. يسمح لك هذا أيضًا بتحديد تشخيص مصدر مشكلات النظام الحالية أو مساعدتك في التنبؤ بالنظام المحتمل المشكلات.

على سبيل المثال، يحتوي سجل النظام النموذجي لأحد المكونات على الإدخالات التالية كما هو موضح أدناه:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

يمكنك تعديل ملف /opt/apigee/conf/logback.xml للتحكم في آلية التسجيل بدون الاضطرار إلى إعادة تشغيل خادم. يحتوي ملف Logback.xml على السمة التالية التي تحدّد معدّل تكرار تحقّق آلية التسجيل من ملف Logback.xml بحثًا عن تغييرات في الإعدادات:

<configuration scan="true" scanPeriod="30 seconds" >

بشكل افتراضي، تتحقق آلية التسجيل من التغييرات كل دقيقة. إذا حذفت الوحدات الزمنية إلى السمة scanPeriod القيمة الافتراضية للملي ثانية.

يوضّح الجدول التالي موقع ملفات السجلّ لمكونات Apigee Edge Private Cloud.

المكوّنات

الموقع الجغرافي

خادم الإدارة

opt/apigee/var/log/edge-management-server

جهاز التوجيه

opt/apigee/var/log/edge-router

معالج الرسائل

opt/apigee/var/log/edge-message-processor

خادم Qpid

opt/apigee/var/log/edge-qpid-server

خادم Apigee Postgres

opt/apigee/var/log/edge-postgres-server

واجهة مستخدم Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

كاساندرا

opt/apigee/var/log/apigee-cassandra

لوحة مفاتيح Qpidd

opt/apigee/var/log/apigee-qpidd

قاعدة بيانات PostgreSQL

opt/apigee/var/log/apigee-postgresql

تفعيل سجلات تصحيح الأخطاء للرسالة واجهة مستخدم Edge ومعالج البيانات

لتفعيل سجلات تصحيح الأخطاء لمعالج الرسائل:

  1. في عقدة "معالج الرسائل"، عدِّل /opt/apigee/customer/application/messsage-processor.properties. إذا لم يكن هذا الملف متوفّرًا، أنشئه.
  2. أضِف السمة التالية إلى الملف:
    conf_system_log.level=DEBUG
  3. إعادة تشغيل معالج الرسائل:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor

لتفعيل سجلات تصحيح الأخطاء لواجهة مستخدم Edge:

  1. في عقدة واجهة مستخدم Edge، عدِّل /opt/apigee/customer/application/ui.properties. إذا لم يكن هذا الملف متوفّرًا، أنشئه.
  2. أضِف السمة التالية إلى الملف:
    conf_application_logger.application=DEBUG
  3. أعِد تشغيل واجهة مستخدم Edge:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-ui إعادة تشغيل

أدوات المراقبة

يمكن أن تساعدك أدوات المراقبة، مثل Nagios وCollectd وGraphite وSplunk وSumologic وMonit. مراقبة بيئة مؤسستك بالكامل وعملياتك التجارية.

المكوّن

Nagios

يتم جمع البيانات

Splunk

عمليات التحقّق على مستوى النظام

استخدام وحدة المعالجة المركزية (CPU)

؟

؟

الذاكرة المتوفّرة/المستعملة

؟

؟

استخدام مساحة القرص

؟

؟

إحصاءات الشبكة

؟

؟

العمليات

؟

عمليات التحقّق من واجهة برمجة التطبيقات

؟

JMX

؟

لغة Java

؟

ملفات السجلّ

؟

الأحداث المهمة

نتيجة قيود المعدل

؟

لا يمكن الوصول إلى خادم الخلفية (Hybris أو SharePoint)

؟

لا يمكن الوصول إلى FaaS (STS)

؟

الأحداث التحذيرية

لا يمكن الوصول إلى خادم SMTP

؟

تم انتهاك اتفاقية مستوى الخدمة

؟