Мониторинг оповещений
Apigee Edge позволяет пересылать оповещения в системные журналы или внешние системы/инструменты мониторинга, когда возникает ошибка или сбой из-за сбоя события. Эти оповещения могут быть оповещениями/событиями системного уровня или уровня приложения. Оповещения уровня приложения — это в основном настраиваемые оповещения, создаваемые на основе сгенерированных событий. Сетевой администратор обычно настраивает индивидуальные условия. Для получения дополнительной информации об оповещениях обратитесь в службу поддержки Apigee.
Установка порогов оповещения
Установите порог, после которого должно быть сгенерировано оповещение. То, что вы устанавливаете, зависит от конфигурации вашего оборудования. Порог должен быть установлен в соответствии с вашими возможностями. Например, Apigee Edge может оказаться слишком низким, если у вас всего 6 ГБ. Вы можете назначить порог с критерием, равным (=) или больше (>). Вы также можете указать интервал времени между двумя последовательными генерации оповещений. Вы можете использовать опцию часы/минуты/секунды.
Критерии настройки оповещений на уровне системы
В следующей таблице описаны критерии:
Тревога | Рекомендуемый порог | Описание |
---|---|---|
Низкая память | 500 МБ | Памяти слишком мало для запуска компонента |
Недостаточно места на диске (/var/log) | 8 ГБ | На диске слишком мало места. |
Высокая нагрузка | 3+ | Число процессов, ожидающих запуска, неожиданно увеличилось |
Процесс остановлен | Н/Д, логическое значение true или false | Процесс Apigee Java в системе остановлен |
Проверка портов, специфичных для Apigee, и сторонних портов
Проверьте следующие порты, чтобы убедиться, что они активны.
- Порты 4526, 4527 и 4528 на сервере управления, маршрутизаторе и процессоре сообщений.
- Порты 1099, 1100 и 1101 на сервере управления, маршрутизаторе и процессоре сообщений.
- Порты 8081 и 15999 на маршрутизаторах
- Порты 8082 и 8998 на процессорах сообщений
- Порт 8080 на сервере управления
Проверьте следующие сторонние порты, чтобы убедиться, что они активны:
- Qpid-порт 5672
- Порт Postgres 5432
- Кассандра порт 7000, 7199, 9042, 9160
- ZooKeeper порт 2181
- OpenLDAP-порт 10389
Чтобы определить, какой порт каждый компонент Apigee прослушивает вызовы API, выполните следующие вызовы API на сервере управления (который обычно находится на порту 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
Вывод этих команд будет содержать разделы, аналогичные показанным ниже. В разделе http.management.port
указан номер порта для указанного компонента.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Просмотр журналов
Файлы журналов отслеживают сообщения о событиях/работе системы. Сообщения появляются в журнале при запуске и завершении процессов или при возникновении ошибки. Просматривая файлы журналов, вы можете получить информацию о компонентах системы, например, процессоре, памяти, диске, нагрузке, процессах и т. д. до и после достижения состояния сбоя. Это также позволяет вам идентифицировать и диагностировать источник текущих проблем системы или помочь вам предсказать потенциальные проблемы системы.
Например, типичный системный журнал компонента содержит следующие записи, как показано ниже:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Вы можете отредактировать файл /opt/apigee/conf/logback.xml
, чтобы управлять механизмом ведения журнала без перезапуска сервера. Файл logback.xml содержит следующее свойство, которое задает частоту, с которой механизм ведения журнала проверяет файл logback.xml на наличие изменений конфигурации:
<configuration scan="true" scanPeriod="30 seconds" >
По умолчанию механизм журналирования проверяет наличие изменений каждую минуту. Если вы опустите единицы времени в атрибуте scanPeriod
, по умолчанию будут миллисекунды.
В следующей таблице указано расположение файлов журналов компонентов частного облака Apigee Edge.
Компоненты | Расположение |
---|---|
Сервер управления | |
Маршрутизатор | |
Процессор сообщений | |
Qpid-сервер | |
Сервер Apigee Postgres | |
Пограничный интерфейс | |
смотритель зоопарка | |
OpenLDAP | |
Кассандра | |
Qpidd | |
База данных PostgreSQL | |
Включение журналов отладки для процессора сообщений и пользовательского интерфейса Edge
Чтобы включить журналы отладки для процессора сообщений:
- В узле «Обработчик сообщений» отредактируйте
/opt/apigee/customer/application/messsage-processor.properties
. Если этот файл не существует, создайте его. - Добавьте в файл следующее свойство:
conf_system_log.level=DEBUG
- Перезапустите процессор сообщений:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Чтобы включить журналы отладки для пользовательского интерфейса Edge:
- В узле Edge UI отредактируйте
/opt/apigee/customer/application/ui.properties
. Если этот файл не существует, создайте его. - Добавьте в файл следующее свойство:
conf_application_logger.application=DEBUG
- Перезапустите пользовательский интерфейс Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
лучшие практики apigee-monit
При использовании apigee-monit
Apigee рекомендует вам:
- Прекратите мониторинг компонента перед выполнением какой-либо операции, которая его запускает или останавливает, например резервного копирования или обновления.
- Контролируйте
apigee-monit
с помощью такого инструмента, какcron
. Дополнительные сведения см. в разделе Мониторинг apigee-monit .
Инструменты мониторинга
Такие инструменты мониторинга, как Nagios, Collectd, Graphite, Splunk, Sumologic и Monit, могут помочь вам контролировать всю корпоративную среду и бизнес-процессы.
Компонент | Нагиос | Собран | Спланк | |
---|---|---|---|---|
Проверки на уровне системы | Загрузка процессора | |||
Свободная/используемая память | ||||
Использование дискового пространства | ||||
Статистика сети | ||||
Процессы | ||||
API-проверки | ||||
JMX | ||||
Ява | ||||
Файлы журналов | ||||
Критические события | Достигнут предел ставки | |||
Внутренний сервер (Hybris или SharePoint) недоступен. | ||||
FaaS (STS) недоступен | ||||
Предупреждающие события | SMTP-сервер не доступен | |||
SLA нарушены |