Мониторинг лучших практик

Мониторинг оповещений

Apigee Edge позволяет пересылать оповещения в системные журналы или внешние системы/инструменты мониторинга при возникновении ошибки или сбоя, вызванного сбоем какого-либо события. Эти оповещения могут быть системными или прикладными. Оповещения уровня приложения — это, как правило, настраиваемые оповещения, создаваемые на основе произошедших событий. Сетевой администратор обычно настраивает пользовательские условия. Для получения дополнительной информации об оповещениях обратитесь в службу поддержки Apigee.

Установка пороговых значений оповещений

Установите пороговое значение, после которого необходимо сгенерировать оповещение. То, что вы установите, зависит от конфигурации вашего оборудования. Пороговое значение следует устанавливать в зависимости от емкости хранилища. Например, Apigee Edge может быть слишком низким, если у вас всего 6 ГБ памяти. Вы можете назначить пороговое значение, используя критерий «равно» (=) или «больше» (>). Вы также можете указать временной интервал между двумя последовательными оповещениями. Можно использовать параметр «часы/минуты/секунды».

Критерии настройки оповещений на системном уровне

Критерии описаны в следующей таблице:

Тревога Предлагаемый порог Описание

Мало памяти

500 МБ

Слишком мало памяти для запуска компонента

Мало места на диске (/var/log)

8 ГБ

Места на диске стало слишком мало.

Высокая нагрузка

3+

Количество процессов, ожидающих запуска, неожиданно возросло

Процесс остановлен

N/A, логическое значение «истина» или «ложь»

Процесс Apigee Java в системе остановлен

Проверка портов Apigee и сторонних портов

Контролируйте следующие порты, чтобы убедиться, что они активны

  • Порты 4526, 4527 и 4528 на сервере управления, маршрутизаторе и процессоре сообщений
  • Порты 1099, 1100 и 1101 на сервере управления, маршрутизаторе и процессоре сообщений
  • Порты 8081 и 15999 на маршрутизаторах
  • Порты 8082 и 8998 на процессорах сообщений
  • Порт 8080 на сервере управления

Проверьте следующие сторонние порты, чтобы убедиться, что они активны:

  • Qpid порт 5672
  • Порт Postgres 5432
  • Порт Кассандра 7000, 7199, 9042, 9160
  • ZooKeeper порт 2181
  • Порт SymasLDAP 10389

Чтобы определить, на каком порту каждый компонент Apigee прослушивает вызовы API, выполните следующие вызовы API на сервер управления (который обычно находится на порту 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

Вывод этих команд будет содержать разделы, аналогичные показанным ниже. Раздел http.management.port содержит номер порта для указанного компонента.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Просмотр журналов

Файлы журналов отслеживают сообщения о событиях/работе системы. Сообщения появляются в журнале при запуске и завершении процессов, а также при возникновении ошибки. Просматривая файлы журналов, вы можете получить информацию о компонентах системы, например, о процессоре, памяти, диске, нагрузке, процессах и т. д., до и после возникновения сбоя. Это также позволяет выявить и диагностировать источник текущих системных проблем или предсказать потенциальные проблемы.

Например, типичный системный журнал компонента содержит следующие записи, как показано ниже:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Вы можете отредактировать файл /opt/apigee/conf/logback.xml , чтобы управлять механизмом ведения журнала без перезапуска сервера. Файл logback.xml содержит следующее свойство, которое задаёт частоту, с которой механизм ведения журнала проверяет файл logback.xml на наличие изменений конфигурации:

<configuration scan="true" scanPeriod="30 seconds" >

По умолчанию механизм журналирования проверяет наличие изменений каждую минуту. Если не указать единицы времени в атрибуте scanPeriod , по умолчанию будут использоваться миллисекунды.

В следующей таблице указано расположение файлов журналов компонентов Apigee Edge Private Cloud.

Компоненты Расположение

Сервер управления

opt/apigee/var/log/edge-management-server

Маршрутизатор

opt/apigee/var/log/edge-router

Процессор сообщений

opt/apigee/var/log/edge-message-processor

Qpid-сервер

opt/apigee/var/log/edge-qpid-server

Сервер Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Edge UI

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

SymasLDAP

opt/apigee/var/log/apigee-openldap

Кассандра

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

База данных PostgreSQL

opt/apigee/var/log/apigee-postgresql

Включение журналов отладки для Message Processor и Edge UI

Чтобы включить журналы отладки для обработчика сообщений:

  1. В узле «Обработчик сообщений» отредактируйте /opt/apigee/customer/application/message-processor.properties . Если этот файл отсутствует, создайте его.
  2. Добавьте в файл следующее свойство:
    conf_system_log.level=DEBUG
  3. Перезапустите обработчик сообщений:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Чтобы включить журналы отладки для Edge UI:

  1. В узле Edge UI отредактируйте файл /opt/apigee/customer/application/ui.properties . Если этот файл отсутствует, создайте его.
  2. Добавьте в файл следующее свойство:
    conf_application_logger.application=DEBUG
  3. Перезапустите Edge UI:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

лучшие практики apigee-monit

При использовании apigee-monit Apigee рекомендует вам:

  • Прекратите мониторинг компонента, прежде чем выполнить любую операцию, которая запускает или останавливает его, например резервное копирование или обновление.
  • Мониторинг apigee-monit можно осуществлять с помощью инструмента, например cron . Подробнее см. в разделе Мониторинг apigee-monit .

Инструменты мониторинга

Инструменты мониторинга, такие как Nagios, Collectd, Graphite, Splunk, Sumologic и Monit, помогут вам контролировать всю корпоративную среду и бизнес-процессы.

Компонент Нагиос Собрано Сплун

Проверки на системном уровне

загрузка ЦП

Свободная/использованная память

Использование дискового пространства

Статистика сети

Процессы

API-проверки

JMX

Ява

Файлы журналов

Критические события

Достигнут предел скорости

Внутренний сервер (Hybris или SharePoint) недоступен

FaaS (STS) недоступен

Предупреждающие события

SMTP-сервер недоступен

Нарушены SLA