Edge для частного облака v4.18.01
Как правило, в производственной настройке необходимо включить механизмы мониторинга в развертывании Apigee Edge для частного облака. Эти методы мониторинга предупреждают сетевых администраторов (или операторов) об ошибке или сбое. О каждой возникшей ошибке сообщается в виде предупреждения в Apigee Edge. Дополнительную информацию об оповещениях см. в разделе «Рекомендации по мониторингу» .
Для простоты компоненты Apigee подразделяются в основном на две категории:
- Службы Java-сервера, специфичные для Apigee. К ним относятся сервер управления, процессор сообщений, сервер Qpid и сервер Postgres.
- Сторонние службы — к ним относятся Nginx Router, Apache Cassandra, Apache ZooKeeper, OpenLDAP, база данных PostgreSQL и Qpid.
При локальном развертывании Apigee Edge в следующей таблице представлен краткий обзор параметров, которые вы можете отслеживать:
Компонент | Системные проверки | Статистика на уровне процесса | Проверки уровня API | Проверки потока сообщений | Специфический для компонента | |
---|---|---|---|---|---|---|
Java-сервисы, специфичные для Apigee | Сервер управления | ? | ? | ? | ||
Процессор сообщений | ? | ? | ? | ? | ||
Qpid-сервер | ? | ? | ? | |||
Постгрес-сервер | ? | ? | ? | |||
Сторонние услуги | Апач Кассандра | ? | ? | |||
Хранитель зоопарка Апач | ? | ? | ||||
OpenLDAP | ? | ? | ||||
База данных PostgreSQL | ? | ? | ||||
Qpid | ? | ? | ||||
Маршрутизатор Nginx | ? | ? | ? |
В общем, после установки Apigee Edge вы можете выполнить следующие задачи мониторинга, чтобы отслеживать производительность установки Apigee Edge для частного облака.
Проверка работоспособности системы
Очень важно измерять параметры работоспособности системы, такие как загрузка ЦП, использование памяти и подключение портов, на более высоком уровне. Вы можете отслеживать следующие параметры, чтобы получить представление о состоянии системы.
- Использование ЦП — указывает базовую статистику (Пользователь/Система/Ожидание ввода-вывода/Простой) об использовании ЦП. Например, общее количество процессоров, используемых системой.
- Свободная/используемая память — определяет использование системной памяти в байтах. Например, физическая память, используемая системой.
- Использование дискового пространства — указывает информацию о файловой системе на основе текущего использования диска. Например, пространство на жестком диске, используемое системой.
- Средняя нагрузка — указывает количество процессов, ожидающих запуска.
- Сетевая статистика — сетевые пакеты и/или байты, переданные и полученные, а также ошибки передачи определенного компонента.
Процессы/Проверки приложений
На уровне процесса вы можете просмотреть важную информацию обо всех запущенных процессах. Например, к ним относится статистика использования памяти и ЦП, которую использует процесс или приложение. Для таких процессов, как qpidd, postgres postmaster, java и т. д., вы можете отслеживать следующее:
- Идентификация процесса . Определите конкретный процесс Apigee. Например, вы можете отслеживать наличие Java-процесса сервера Apigee.
- Статистика потоков : просмотр базовых шаблонов потоков, используемых процессом. Например, вы можете отслеживать пиковое количество потоков, количество потоков для всех процессов.
- Использование памяти : просмотр использования памяти всеми процессами Apigee. Например, вы можете отслеживать такие параметры, как использование памяти в куче, использование памяти без кучи, используемой процессом.
Проверки уровня API
На уровне API вы можете отслеживать, работает ли сервер для часто используемых вызовов API, проксируемых Apigee. Например, вы можете выполнить проверку API на сервере управления, маршрутизаторе и процессоре сообщений, вызвав следующую команду cURL:
curl http://<host>:<port>/v1/servers/self/up
Где <хост> — это IP-адрес компонента Apigee Edge. Номер <port> индивидуален для каждого компонента Edge. Например:
Сервер управления: 8080
- Маршрутизатор: 8081
- Процессор сообщений: 8082
- и т. д.
См. отдельные разделы ниже для получения информации о запуске этой команды для каждого компонента.
Этот вызов возвращает «истину» и «ложь». Для достижения наилучших результатов вы также можете выполнять вызовы API непосредственно на серверной стороне (с которой взаимодействует программное обеспечение Apigee), чтобы быстро определить, существует ли ошибка в программной среде Apigee или на внутренней стороне.
Примечание. Для мониторинга ваших прокси-серверов API вы также можете использовать API Health Apigee. API Health выполняет запланированные вызовы ваших прокси-серверов API и уведомляет вас, когда они выходят из строя и каким образом. Если вызовы успешны, API Health показывает время ответа и может даже уведомить вас о высокой задержке ответа. API Health может совершать вызовы из разных мест по всему миру, чтобы сравнивать поведение API между регионами.
Проверка потока сообщений
Вы можете собирать данные от маршрутизаторов и обработчиков сообщений о шаблоне/статистике потока сообщений. Это позволяет отслеживать следующее:
- Количество активных клиентов
- Количество ответов (10X, 20X, 30X, 40X и 50X)
- Неисправности подключения
Это поможет вам предоставить информационные панели для потока сообщений API. Подробнее см.:
- Как отслеживать процессор сообщений
- Обзор бета-версии панели мониторинга Apigee для маршрутизатора
Проверка работоспособности маршрутизатора процессора сообщений
Маршрутизатор реализует механизм проверки работоспособности, чтобы определить, какой из процессоров сообщений работает должным образом. Если процессор сообщений обнаруживается как неработающий или медленный, маршрутизатор может автоматически вывести процессор сообщений из строя. Если это произойдет, маршрутизатор записывает сообщения «Mark Down» в файл журнала маршрутизатора по адресу /opt/apigee/var/log/edge-router/logs/system.log .
Вы можете отслеживать эти сообщения в файле журнала маршрутизатора. Например, если Маршрутизатор выводит из строя Message Processor, он записывает в журнал сообщение в виде:
2014-05-06 15:51:52,159 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now DISCONNECTED. handle = <MP_IP> at 1399409512159 2014-04-17 12:54:48,512 org: env: nioEventLoopGroup-2-2 INFO HEARTBEAT - HBTracker.gotResponse() : No HeartBeat detected from /<MP_IP>:<PORT> Mark Down
где /<MP_IP>:<PORT> — IP-адрес и номер порта процессора сообщений.
Если позже Маршрутизатор выполнит проверку работоспособности и определит, что процессор сообщений работает правильно, маршрутизатор автоматически вернет процессор сообщений в режим вращения. Маршрутизатор также записывает в журнал сообщение «Mark Up» в виде:
2014-05-06 16:07:29,054 org: env: RPCClientClientProtocolChildGroup-RPC-0 INFO CLUSTER - ServerState.setState() : State of 2a8a0e0c-3619-416f-b037-8a42e7ad4577 is now CONNECTED. handle = <IP> at 1399410449054 2014-04-17 12:55:06,064 org: env: nioEventLoopGroup-4-1 INFO HEARTBEAT - HBTracker.updateHB() : HeartBeat detected from /<IP>:<PORT> Mark Up