Alerty monitorowania
Apigee Edge umożliwia przekierowywanie alertów do syslogów lub zewnętrznych systemów/narzędzi monitorujących, gdy wystąpi błąd lub awaria z powodu błędu zdarzenia. Mogą to być alerty/zdarzenia na poziomie systemu lub aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe tworzone na podstawie generowanych zdarzeń. Zwykle administrator sieci konfiguruje warunki niestandardowe. Aby uzyskać więcej informacji o alertach, skontaktuj się z zespołem pomocy Apigee.
Ustawianie progów alertów
Ustaw próg, po przekroczeniu którego ma być generowany alert. Ustawienia zależą od konfiguracji sprzętu. Próg powinien być ustawiony w zależności od Twojej pojemności. Na przykład w przypadku Apigee Edge może być zbyt mała, jeśli masz tylko 6 GB pojemności. Możesz przypisać próg za pomocą kryterium równe (=) lub większe (>). Możesz też określić przedział czasu między kolejnymi generowaniami alertów. Możesz użyć opcji godzin/minut/sekund.
Kryteria ustawiania alertów na poziomie systemu
Tabela poniżej zawiera opis kryteriów:
Alert | Sugerowany próg | Opis |
---|---|---|
Mało pamięci |
500 MB |
Za mało pamięci na uruchomienie komponentu |
Mało miejsca na dysku (/var/log) |
8 GB |
Za mało miejsca na dysku. |
Wysokie obciążenie |
3+ |
Nieoczekiwanie zwiększyła się liczba procesów oczekujących na uruchomienie |
Proces został zatrzymany |
Nie dotyczy, wartość logiczna (prawda lub fałsz) |
Proces Apigee Java w systemie został zatrzymany |
Sprawdzanie portów związanych z Apigee i z usługami zewnętrznymi
Sprawdź, czy te porty są aktywne
- Porty 4526, 4527 i 4528 na serwerze zarządzania, routerze i przetwarzaczu wiadomości
- Porty 1099, 1100 i 1101 na serwerze zarządzania, routerze i przetwarzaczu wiadomości
- Porty 8081 i 15999 na routerach
- Porty 8082 i 8998 na procesorach komunikatów
- Port 8080 na serwerze zarządzania
Sprawdź, czy te porty firm zewnętrznych są aktywne:
- Port Qpid 5672
- Port Postgres 5432
- Port Cassandra 7000, 7199, 9042, 9160
- Port ZooKeeper 2181
- Port OpenLDAP 10389
Aby określić, na którym porcie dany komponent Apigee nasłuchuje wywołań interfejsu API, wykonaj te wywołania interfejsu API do serwera zarządzania (który zwykle znajduje się na porcie 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
Dane wyjściowe tych poleceń będą zawierać sekcje podobne do tej poniżej. W sekcji http.management.port
podany jest numer portu określonego komponentu.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Wyświetlanie logów
Pliki dziennika zawierają informacje o zdarzeniach i działaniach systemu. Komunikaty pojawiają się w logu, gdy procesy się zaczynają i kończą lub gdy wystąpi błąd. Dzięki wyświetlaniu plików dziennika możesz uzyskać informacje o komponentach systemu, takich jak procesor, pamięć, dysk, obciążenie czy procesy, przed i po wystąpieniu błędu. Dzięki temu możesz też zidentyfikować i zdiagnozować źródło bieżących problemów z systemem lub przewidzieć potencjalne problemy z systemem.
Przykładowy dziennik systemowy komponentu zawiera te wpisy:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Możesz edytować plik /opt/apigee/conf/logback.xml
, aby kontrolować mechanizm rejestrowania bez konieczności restartowania serwera. Plik logback.xml zawiera tę właściwość, która określa częstotliwość sprawdzania przez mechanizm rejestrowania zmian w pliku logback.xml:
<configuration scan="true" scanPeriod="30 seconds" >
Domyślnie mechanizm rejestrowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu w atrybucie scanPeriod
, zostaną one domyślnie ustawione na milisekundy.
W tabeli poniżej podano lokalizację plików dziennika komponentów Apigee Edge Private Cloud.
Komponenty | Lokalizacja |
---|---|
Serwer zarządzania |
|
Router |
|
procesor komunikatów |
|
Qpid Server |
|
Serwer Apigee Postgres |
|
Interfejs Edge |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
Baza danych PostgreSQL |
|
Włączanie dzienników debugowania w przypadku procesora wiadomości i interfejsu Edge
Aby włączyć dzienniki debugowania dla usługi Message Processor:
- W węźle Procesor wiadomości dokonaj edycji:
/opt/apigee/customer/application/messsage-processor.properties
. Jeśli plik nie istnieje, utwórz go. - Dodaj do pliku tę właściwość:
conf_system_log.level=DEBUG
- Ponownie uruchom przetwarzacz wiadomości:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Aby włączyć dzienniki debugowania interfejsu Edge:
- W węźle interfejsu Edge edytuj
/opt/apigee/customer/application/ui.properties
. Jeśli plik nie istnieje, utwórz go. - Dodaj do pliku tę właściwość:
conf_application_logger.application=DEBUG
- Ponownie uruchom interfejs Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
apigee-monit sprawdzone metody
Podczas korzystania z apigee-monit
Apigee zaleca:
- Zatrzymaj monitorowanie komponentu, zanim wykonasz jakąkolwiek operację, która go uruchamia lub zatrzymuje, np. kopię zapasową lub uaktualnienie.
- Sprawdzaj
apigee-monit
za pomocą narzędzia takiego jakcron
. Więcej informacji znajdziesz w artykule Monitorowanie apige-monit.
Narzędzia do monitorowania
Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą pomóc w monitorowaniu całego środowiska korporacyjnego i procesów biznesowych.
Komponent | Nagios | Collectd | Splunk | |
---|---|---|---|---|
Sprawdzanie na poziomie systemu |
Wykorzystanie procesora |
|||
Wolna/wykorzystana pamięć |
||||
Wykorzystanie miejsca na dysku |
||||
Statystyki sieci |
||||
Procesy |
|
|
||
Sprawdzanie interfejsu API |
||||
JMX |
||||
Java |
||||
Pliki dziennika |
||||
Krytyczne zdarzenia |
Ograniczenie liczby żądań |
|||
Brak połączenia z serwerem backendu (Hybris lub SharePoint) |
||||
Nie można uzyskać dostępu do FaaS (STS) |
||||
zdarzenia ostrzegawczego |
Nie można połączyć się z serwerem SMTP |
|||
Naruszone gwarancje jakości usług |