Alerty monitorowania
Apigee Edge umożliwia przekazywanie alertów do dzienników systemowych lub zewnętrznych systemów/narzędzi monitorowania, gdy wystąpi błąd lub awaria z powodu niepowodzenia zdarzenia. Mogą to być alerty lub zdarzenia na poziomie systemu lub aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe, które są tworzone na podstawie wygenerowanych zdarzeń. Warunki niestandardowe są zwykle konfigurowane przez administratora sieci. Aby uzyskać więcej informacji o alertach, skontaktuj się z zespołem pomocy Apigee.
Ustawianie progów alertów
Ustaw próg, po przekroczeniu którego ma być generowany alert. Ustawienia zależą od konfiguracji sprzętu. Próg powinien być ustawiony w odniesieniu do Twoich możliwości. Na przykład Apigee Edge może być zbyt mały, jeśli masz tylko 6 GB miejsca. Możesz przypisać próg z kryterium równym (=) lub większym niż (>). Możesz też określić przedział czasu między wygenerowaniem dwóch kolejnych alertów. Możesz użyć opcji godziny/minuty/sekundy.
Kryteria ustawiania alertów na poziomie systemu
Kryteria są opisane w tabeli poniżej:
Alert | Sugerowany próg | Opis |
---|---|---|
Mało pamięci |
500 MB |
Pamięć jest zbyt mała, aby uruchomić komponent |
Mało miejsca na dysku (/var/log) |
8 GB |
Dostępne miejsce na dysku jest zbyt małe. |
Wysokie obciążenie |
3+ |
Liczba procesów oczekujących na uruchomienie nieoczekiwanie wzrosła |
Proces został zatrzymany |
Nie dotyczy, wartość logiczna true lub false |
Proces Java Apigee w systemie został zatrzymany |
Sprawdzanie portów Apigee i portów innych firm
Sprawdź, czy te porty są aktywne:
- Porty 4526, 4527 i 4528 na serwerze zarządzającym, routerze i procesorze wiadomości
- Porty 1099, 1100 i 1101 na serwerze zarządzającym, routerze i procesorze wiadomości
- Porty 8081 i 15999 na routerach
- Porty 8082 i 8998 na procesorach komunikatów
- Port 8080 na serwerze zarządzającym
Sprawdź, czy te porty innych firm są aktywne:
- Port Qpid 5672
- Port Postgres 5432
- Porty Cassandra 7000, 7199, 9042, 9160
- Port ZooKeeper 2181
- Port SymasLDAP 10389
Aby określić, na którym porcie każdy komponent Apigee nasłuchuje wywołań interfejsu API, wyślij te wywołania interfejsu API do serwera zarządzania (zwykle na porcie 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
Wynik tych poleceń będzie zawierać sekcje podobne do tych poniżej. W sekcji http.management.port
podany jest numer portu określonego komponentu.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Wyświetlanie logów
Pliki dziennika śledzą komunikaty dotyczące zdarzenia lub działania systemu. Wiadomości pojawiają się w logu, gdy procesy się rozpoczynają i kończą lub gdy wystąpi błąd. Wyświetlając pliki dziennika, możesz uzyskać informacje o komponentach systemu, np. procesorze, pamięci, dysku, obciążeniu, procesach itp., przed osiągnięciem stanu błędu i po jego osiągnięciu. Umożliwia to również identyfikowanie i diagnozowanie źródła bieżących problemów z systemem lub przewidywanie potencjalnych problemów z systemem.
Na przykład typowy dziennik systemowy komponentu zawiera wpisy widoczne poniżej:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Możesz edytować /opt/apigee/conf/logback.xml
, aby kontrolować mechanizm rejestrowania bez konieczności ponownego uruchamiania serwera. Plik logback.xml zawiera tę właściwość, która określa częstotliwość, z jaką mechanizm rejestrowania sprawdza plik logback.xml pod kątem zmian konfiguracji:
<configuration scan="true" scanPeriod="30 seconds" >
Domyślnie mechanizm logowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu w atrybucie scanPeriod
, domyślnie będą to milisekundy.
W tabeli poniżej znajdziesz lokalizacje plików dziennika komponentów Apigee Edge Private Cloud.
Komponenty | Lokalizacja |
---|---|
Serwer zarządzania |
|
Router |
|
procesor komunikatów |
|
Serwer Qpid |
|
Serwer Postgres Apigee |
|
Interfejs Edge |
|
ZooKeeper |
|
SymasLDAP |
|
Cassandra |
|
Qpidd |
|
Baza danych PostgreSQL |
|
Włączanie dzienników debugowania procesora wiadomości i interfejsu Edge
Aby włączyć dzienniki debugowania dla procesora wiadomości:
- W węźle Message Processor (Procesor wiadomości) edytuj
/opt/apigee/customer/application/message-processor.properties
. Jeśli ten plik nie istnieje, utwórz go. - Dodaj do pliku tę właściwość:
conf_system_log.level=DEBUG
- Uruchom ponownie procesor wiadomości:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Aby włączyć dzienniki debugowania interfejsu Edge:
- W węźle interfejsu Edge UI edytuj
/opt/apigee/customer/application/ui.properties
. Jeśli ten plik nie istnieje, utwórz go. - Dodaj do pliku tę właściwość:
conf_application_logger.application=DEBUG
- Uruchom ponownie interfejs Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
Sprawdzone metody dotyczące apigee-monit
Podczas korzystania z apigee-monit
zalecamy:
- Zatrzymaj monitorowanie komponentu przed wykonaniem dowolnej operacji, która go uruchamia lub zatrzymuje, np. tworzenia kopii zapasowej lub uaktualniania.
- Monitoruj
apigee-monit
za pomocą narzędzia takiego jakcron
. Więcej informacji znajdziesz w artykule Monitorowanie apigee-monit.
Narzędzia do monitorowania
Narzędzia do monitorowania, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą pomóc Ci monitorować całe środowisko przedsiębiorstwa i procesy biznesowe.
Komponent | Nagios | Collectd | Splunk | |
---|---|---|---|---|
Sprawdzanie na poziomie systemu |
Wykorzystanie procesora |
|||
Wolna/wykorzystana pamięć |
||||
Wykorzystanie miejsca na dysku |
||||
Statystyki sieci |
||||
Procesy |
|
|
||
Testy interfejsu API |
||||
JMX |
||||
Java |
||||
Pliki dziennika |
||||
Krytyczne zdarzenia |
Osiągnięcie limitu liczby żądań |
|||
Nie można nawiązać połączenia z serwerem backendu (Hybris lub SharePoint) |
||||
Nie można uzyskać dostępu do FaaS (STS) |
||||
zdarzenia ostrzegawczego |
Nie można połączyć się z serwerem SMTP |
|||
Naruszone gwarancje jakości usług |