Alerty monitorowania
Apigee Edge umożliwia przekazywanie alertów do syslog lub zewnętrznych systemów/narzędzi monitorujących, gdy wystąpi błąd lub niepowodzenie z powodu niepowodzenia zdarzenia. Mogą to być alerty na poziomie systemu alertów/zdarzeń na poziomie aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe, tworzone na podstawie wygenerowanych zdarzeń. Niestandardowy administrator sieci zwykle konfiguruje warunków. Aby dowiedzieć się więcej o alertach, skontaktuj się z zespołem pomocy Apigee.
Ustawianie progów alertów
Ustaw próg, po którym musi zostać wygenerowany alert. Wartość, którą ustawisz, zależy od konfiguracji sprzętowej. Próg powinien być ustalany na podstawie wydajności. Na przykład Apigee Edge może być za niska, jeśli masz tylko 6 GB miejsca. Możesz przypisać próg z wartością (=), lub większe od (>). Możesz też określić przedział czasu między dwoma kolejnymi generowania alertów. Możesz użyć opcji godzin/minut/sekund.
Kryteria ustawiania alertów na poziomie systemu
Kryteria są opisane w tabeli poniżej:
Alert | Sugerowany próg | Opis |
---|---|---|
Mało pamięci |
500MB |
Za mało pamięci, aby uruchomić komponent |
Mało miejsca na dysku (/var/log) |
8 GB |
Na dysku spadło za mało miejsca. |
Duże obciążenie |
3+ |
Liczba oczekujących na uruchomienie procesów nieoczekiwanie wzrosła |
Proces zatrzymany |
Nie dotyczy, wartość logiczna prawda lub fałsz |
Proces Java Apigee w systemie został zatrzymany |
Sprawdzam możliwości specyficzne dla Apigee i aplikacji innych firm Porty
Sprawdzaj te porty, aby mieć pewność, że są aktywne
- Port 4526, 4527 i 4528 na serwerze zarządzania, routerze i procesorze wiadomości
- Port 1099, 1100 i 1101 na serwerze zarządzania, routerze i procesorze wiadomości
- Port 8081 i 15999 w routerach
- Port 8082 i 8998 w procesorach komunikatów
- Port 8080 na serwerze zarządzania
Sprawdź, czy te porty innych firm są aktywne:
- Port Qpid 5672
- Port Postgres 5432
- Cassandra port 7000, 7199, 9042, 9160
- ZooKeeper port 2181
- Port 10389 OpenLDAP
Aby określić, na którym porcie każdy komponent Apigee nasłuchuje wywołań interfejsu API, wykonaj następujące wywołania interfejsu API do serwera zarządzania (zazwyczaj na porcie 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
Wyniki tych poleceń będą zawierać sekcje podobne do pokazanej poniżej.
Sekcja http.management.port
zawiera numer portu do określonego komponentu.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Wyświetlanie logów
Pliki dziennika przechowują komunikaty dotyczące zdarzeń i działań systemu. Wiadomości są wyświetlane w dzienniku po rozpoczęciu i zakończeniu procesów lub gdy wystąpi stan błędu. Wyświetlając dziennik można uzyskać informacje o składnikach systemu, takich jak CPU, pamięć, dysk, obciążenie przed i po wystąpieniu błędu. Pozwala to również identyfikować diagnozowanie źródeł bieżących problemów z systemem lub pomaga przewidywać potencjalne systemy .
Na przykład typowy dziennik systemowy komponentu zawiera takie wpisy:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Plik /opt/apigee/conf/logback.xml
możesz edytować, aby kontrolować mechanizm logowania bez
ponowne uruchomienie serwera. Plik logback.xml zawiera następującą właściwość, która ustawia
częstotliwość, z jaką mechanizm logowania sprawdza plik logback.xml pod kątem zmian konfiguracji:
<configuration scan="true" scanPeriod="30 seconds" >
Domyślnie mechanizm logowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu
do atrybutu scanPeriod
, domyślnie ustawiona jest wartość w milisekundach.
W tabeli poniżej znajdziesz lokalizację plików logów komponentów Apigee Edge Private Cloud.
Komponenty | Lokalizacja |
---|---|
Serwer zarządzania |
|
Router |
|
procesor komunikatów |
|
Serwer Qpid |
|
Serwer Apigee Postgres |
|
Interfejs Edge |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
Baza danych PostgreSQL |
|
Włączanie dzienników debugowania dla wiadomości Interfejs procesora i Edge
Aby włączyć dzienniki debugowania dla procesora wiadomości:
- W węźle procesora wiadomości edytuj
/opt/apigee/customer/application/messsage-processor.properties
Jeśli ten plik nie istnieje, należy go utworzyć. - Dodaj do pliku tę właściwość:
conf_system_log.level=DEBUG
- Ponownie uruchom procesor wiadomości:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Aby włączyć dzienniki debugowania dla interfejsu Edge:
- Edytuj
/opt/apigee/customer/application/ui.properties
w węźle Edge UI. Jeśli plik nie istnieje, utwórz go. - Dodaj do pliku tę właściwość:
conf_application_logger.application=DEBUG
- Ponownie uruchom interfejs Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
Sprawdzone metody dotyczące apigee-monit
Przy korzystaniu z apigee-monit
Apigee zaleca:
- Zatrzymaj monitorowanie komponentu, zanim go wykonasz która uruchamia lub zatrzymuje operację, np. tworzenie kopii zapasowej lub uaktualnienie.
- Monitoruj
apigee-monit
za pomocą takiego narzędzia jakcron
. Więcej Więcej informacji znajdziesz w artykule Monitorowanie apigee-monit.
Narzędzia monitorujące
Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą Ci pomóc monitorowanie całego środowiska biznesowego i procesów biznesowych.
Komponent | Nagios | Zebrano | Splunk | |
---|---|---|---|---|
Kontrole na poziomie systemu |
Wykorzystanie procesora |
|||
Wolna/wykorzystywana pamięć |
||||
Wykorzystanie miejsca na dysku |
||||
Statystyki sieci |
||||
Procesy |
|
|
||
Testy interfejsu API |
||||
JMX |
||||
Java |
||||
Pliki dziennika |
||||
Zdarzenia krytyczne |
Osiągnięcie limitu szybkości |
|||
Nie można uzyskać dostępu do serwera backendu (Hybris lub SharePoint) |
||||
Brak dostępu do mechanizmu FaaS (STS) |
||||
zdarzenia ostrzegawczego |
Nie można nawiązać połączenia z serwerem SMTP |
|||
Naruszone gwarancje jakości usług |