Мониторинг лучших практик

Edge для частного облака v. 4.17.01

Мониторинг оповещений

Apigee Edge позволяет пересылать оповещения в системные журналы или внешние системы/инструменты мониторинга, когда возникает ошибка или сбой из-за сбоя события. Эти оповещения могут быть оповещениями/событиями системного уровня или уровня приложения. Оповещения уровня приложения — это в основном настраиваемые оповещения, создаваемые на основе сгенерированных событий. Сетевой администратор обычно настраивает индивидуальные условия. Для получения дополнительной информации об оповещениях обратитесь в службу поддержки Apigee.

Установка пороговых значений оповещений

Установите порог, после которого должно быть сгенерировано оповещение. То, что вы устанавливаете, зависит от конфигурации вашего оборудования. Порог должен быть установлен в соответствии с вашими возможностями. Например, Apigee Edge может оказаться слишком низким, если у вас всего 6 ГБ. Вы можете назначить порог с критерием, равным (=) или больше (>). Вы также можете указать интервал времени между двумя последовательными генерации оповещений. Вы можете использовать опцию часы/минуты/секунды.

Критерии настройки оповещений на уровне системы

В следующей таблице описаны критерии:

Тревога

Рекомендуемый порог

Описание

Низкая память

500 МБ

Памяти слишком мало для запуска компонента

Недостаточно места на диске (/var/log)

8 ГБ

На диске слишком мало места.

Высокая нагрузка

3+

Число процессов, ожидающих запуска, неожиданно увеличилось

Процесс остановлен

Н/Д, логическое значение true или false

Процесс Apigee Java в системе остановлен

Проверка портов, специфичных для Apigee, и сторонних портов

Проверьте следующие порты, чтобы убедиться, что они активны.

  • Порты 4526, 4527 и 4528 на сервере управления, маршрутизаторе и процессоре сообщений.
  • Порты 1099, 1100 и 1101 на сервере управления, маршрутизаторе и процессоре сообщений.
  • Порты 8081 и 15999 на маршрутизаторах
  • Порты 8082 и 8998 на процессорах сообщений

Порт 8080 на сервере управления. Проверьте следующие сторонние порты, чтобы убедиться, что они активны:

  • Qpid-порт 5672
  • Порт Postgres 5432
  • Кассандра порт 7000, 7199, 9042, 9160
  • ZooKeeper порт 2181
  • OpenLDAP-порт 10389

Чтобы определить, какой порт каждый компонент Apigee прослушивает вызовы API, выполните следующие вызовы API на сервере управления (который обычно находится на порту 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Вывод этих команд будет содержать разделы, аналогичные показанным ниже. В разделе « http.management.port » указан номер порта для указанного компонента.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Просмотр журналов

Файлы журналов отслеживают сообщения о событиях/работе системы. Сообщения появляются в журнале при запуске и завершении процессов или при возникновении ошибки. Просматривая файлы журналов, вы можете получить информацию о компонентах системы, например, процессоре, памяти, диске, нагрузке, процессах и т. д. до и после достижения состояния сбоя. Это также позволяет вам идентифицировать и диагностировать источник текущих проблем системы или помочь вам прогнозировать потенциальные проблемы системы.

Например, типичный системный журнал компонента содержит следующие записи, как показано ниже:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Вы можете отредактировать файл /opt/apigee/conf/logback.xml, чтобы управлять механизмом ведения журнала без перезапуска сервера. Файл logback.xml содержит следующее свойство, которое задает частоту, с которой механизм ведения журнала проверяет файл logback.xml на наличие изменений конфигурации:

<configuration scan="true" scanPeriod="30 seconds" >

По умолчанию механизм журналирования проверяет изменения каждую минуту. Если вы опустите единицы времени в атрибуте scanPeriod , по умолчанию они будут равны миллисекундам.

В следующей таблице показано расположение файлов журналов компонентов частного облака Apigee Edge.

Компоненты

Расположение

Сервер управления

opt/apigee/var/log/edge-management-server

Маршрутизатор

opt/apigee/var/log/edge-router

Процессор сообщений

opt/apigee/var/log/edge-message-processor

Qpid-сервер

opt/apigee/var/log/edge-qpid-сервер

Сервер Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Пограничный интерфейс

opt/apigee/var/log/edge-ui

смотритель зоопарка

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Кассандра

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

База данных PostgreSQL

opt/apigee/var/log/apigee-postgresql

Включение журналов отладки для процессора сообщений и пользовательского интерфейса Edge

Чтобы включить журналы отладки для процессора сообщений:

  1. В узле «Обработчик сообщений» отредактируйте /opt/apigee/customer/application/message-processor.properties . Если этот файл не существует, создайте его.
  2. Добавьте в файл следующее свойство:
    conf_system_log.level=ОТЛАДКА
  3. Перезапустите процессор сообщений:
    > /opt/apigee/apigee-service/bin/apigee-service перезапуск процессора Edge-message

Чтобы включить журналы отладки для пользовательского интерфейса Edge:

  1. В узле Edge UI отредактируйте /opt/apigee/customer/application/ui.properties . Если этот файл не существует, создайте его.
  2. Добавьте в файл следующее свойство:
    conf_application_logger.application=ОТЛАДКА
  3. Перезапустите пользовательский интерфейс Edge:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-UI перезапуск

Инструменты мониторинга

Такие инструменты мониторинга, как Nagios, Collectd, Graphite, Splunk, Sumologic и Monit, могут помочь вам контролировать всю корпоративную среду и бизнес-процессы.

Компонент

Нагиос

Собран

Спланк

Проверки на уровне системы

Загрузка процессора

?

?

Свободная/используемая память

?

?

Использование дискового пространства

?

?

Статистика сети

?

?

Процессы

?

API-проверки

?

JMX

?

Ява

?

Файлы журналов

?

Критические события

Достигнут предел ставки

?

Внутренний сервер (Hybris или SharePoint) недоступен.

?

FaaS (STS) недоступен

?

Предупреждающие события

SMTP-сервер не доступен

?

SLA нарушены

?