Мониторинг оповещений
Apigee Edge позволяет пересылать оповещения в системные журналы или внешние системы/инструменты мониторинга при возникновении ошибки или сбоя, вызванного сбоем какого-либо события. Эти оповещения могут быть системными или прикладными. Оповещения уровня приложения — это, как правило, настраиваемые оповещения, создаваемые на основе произошедших событий. Сетевой администратор обычно настраивает пользовательские условия. Для получения дополнительной информации об оповещениях обратитесь в службу поддержки Apigee.
Установка пороговых значений оповещений
Установите пороговое значение, после которого необходимо сгенерировать оповещение. То, что вы установите, зависит от конфигурации вашего оборудования. Пороговое значение следует устанавливать в зависимости от емкости хранилища. Например, Apigee Edge может быть слишком низким, если у вас всего 6 ГБ памяти. Вы можете назначить пороговое значение, используя критерий «равно» (=) или «больше» (>). Вы также можете указать временной интервал между двумя последовательными оповещениями. Можно использовать параметр «часы/минуты/секунды».
Критерии настройки оповещений на системном уровне
Критерии описаны в следующей таблице:
Тревога | Предлагаемый порог | Описание |
---|---|---|
Мало памяти | 500 МБ | Слишком мало памяти для запуска компонента |
Мало места на диске (/var/log) | 8 ГБ | Места на диске стало слишком мало. |
Высокая нагрузка | 3+ | Количество процессов, ожидающих запуска, неожиданно возросло |
Процесс остановлен | N/A, логическое значение «истина» или «ложь» | Процесс Apigee Java в системе остановлен |
Проверка портов Apigee и сторонних портов
Контролируйте следующие порты, чтобы убедиться, что они активны
- Порты 4526, 4527 и 4528 на сервере управления, маршрутизаторе и процессоре сообщений
- Порты 1099, 1100 и 1101 на сервере управления, маршрутизаторе и процессоре сообщений
- Порты 8081 и 15999 на маршрутизаторах
- Порты 8082 и 8998 на процессорах сообщений
- Порт 8080 на сервере управления
Проверьте следующие сторонние порты, чтобы убедиться, что они активны:
- Qpid порт 5672
- Порт Postgres 5432
- Порт Кассандра 7000, 7199, 9042, 9160
- ZooKeeper порт 2181
- Порт SymasLDAP 10389
Чтобы определить, на каком порту каждый компонент Apigee прослушивает вызовы API, выполните следующие вызовы API на сервер управления (который обычно находится на порту 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
Вывод этих команд будет содержать разделы, аналогичные показанным ниже. Раздел http.management.port
содержит номер порта для указанного компонента.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Просмотр журналов
Файлы журналов отслеживают сообщения о событиях/работе системы. Сообщения появляются в журнале при запуске и завершении процессов, а также при возникновении ошибки. Просматривая файлы журналов, вы можете получить информацию о компонентах системы, например, о процессоре, памяти, диске, нагрузке, процессах и т. д., до и после возникновения сбоя. Это также позволяет выявить и диагностировать источник текущих системных проблем или предсказать потенциальные проблемы.
Например, типичный системный журнал компонента содержит следующие записи, как показано ниже:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Вы можете отредактировать файл /opt/apigee/conf/logback.xml
, чтобы управлять механизмом ведения журнала без перезапуска сервера. Файл logback.xml содержит следующее свойство, которое задаёт частоту, с которой механизм ведения журнала проверяет файл logback.xml на наличие изменений конфигурации:
<configuration scan="true" scanPeriod="30 seconds" >
По умолчанию механизм журналирования проверяет наличие изменений каждую минуту. Если не указать единицы времени в атрибуте scanPeriod
, по умолчанию будут использоваться миллисекунды.
В следующей таблице указано расположение файлов журналов компонентов Apigee Edge Private Cloud.
Компоненты | Расположение |
---|---|
Сервер управления | |
Маршрутизатор | |
Процессор сообщений | |
Qpid-сервер | |
Сервер Apigee Postgres | |
Edge UI | |
ZooKeeper | |
SymasLDAP | |
Кассандра | |
Qpidd | |
База данных PostgreSQL | |
Включение журналов отладки для Message Processor и Edge UI
Чтобы включить журналы отладки для обработчика сообщений:
- В узле «Обработчик сообщений» отредактируйте
/opt/apigee/customer/application/message-processor.properties
. Если этот файл отсутствует, создайте его. - Добавьте в файл следующее свойство:
conf_system_log.level=DEBUG
- Перезапустите обработчик сообщений:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Чтобы включить журналы отладки для Edge UI:
- В узле Edge UI отредактируйте файл
/opt/apigee/customer/application/ui.properties
. Если этот файл отсутствует, создайте его. - Добавьте в файл следующее свойство:
conf_application_logger.application=DEBUG
- Перезапустите Edge UI:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
лучшие практики apigee-monit
При использовании apigee-monit
Apigee рекомендует вам:
- Прекратите мониторинг компонента, прежде чем выполнить любую операцию, которая запускает или останавливает его, например резервное копирование или обновление.
- Мониторинг
apigee-monit
можно осуществлять с помощью инструмента, напримерcron
. Подробнее см. в разделе Мониторинг apigee-monit .
Инструменты мониторинга
Инструменты мониторинга, такие как Nagios, Collectd, Graphite, Splunk, Sumologic и Monit, помогут вам контролировать всю корпоративную среду и бизнес-процессы.
Компонент | Нагиос | Собрано | Сплун | |
---|---|---|---|---|
Проверки на системном уровне | загрузка ЦП | |||
Свободная/использованная память | ||||
Использование дискового пространства | ||||
Статистика сети | ||||
Процессы | ||||
API-проверки | ||||
JMX | ||||
Ява | ||||
Файлы журналов | ||||
Критические события | Достигнут предел скорости | |||
Внутренний сервер (Hybris или SharePoint) недоступен | ||||
FaaS (STS) недоступен | ||||
Предупреждающие события | SMTP-сервер недоступен | |||
Нарушены SLA |