Alerty monitorowania
Apigee Edge umożliwia przekazywanie alertów do syslog lub zewnętrznych systemów/narzędzi monitorujących, gdy wystąpi błąd lub niepowodzenie z powodu niepowodzenia zdarzenia. Mogą to być alerty na poziomie systemu alertów/zdarzeń na poziomie aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe, tworzone na podstawie wygenerowanych zdarzeń. Niestandardowy administrator sieci zwykle konfiguruje warunków. Aby dowiedzieć się więcej o alertach, skontaktuj się z zespołem pomocy Apigee.
Ustawianie progów alertów
Ustaw próg, po którym musi zostać wygenerowany alert. Wartość, którą ustawisz, zależy od konfiguracji sprzętowej. Próg powinien być ustawiony w zależności od pojemności. Na przykład Apigee Edge może być za niska, jeśli masz tylko 6 GB miejsca. Możesz przypisać próg z wartością (=), lub większe od (>). Możesz też określić przedział czasu między dwoma kolejnymi generowania alertów. Możesz użyć opcji godzin/minut/sekund.
Kryteria ustawiania alertów na poziomie systemu
Kryteria są opisane w tabeli poniżej:
Alert | Sugerowany próg | Opis |
---|---|---|
Mało pamięci |
500MB |
Za mało pamięci, aby uruchomić komponent |
Mało miejsca na dysku (/var/log) |
8 GB |
Na dysku spadło za mało miejsca. |
Wysokie obciążenie |
3+ |
Liczba oczekujących na uruchomienie procesów nieoczekiwanie wzrosła |
Proces zatrzymany |
Nie dotyczy, wartość logiczna prawda lub fałsz |
Proces Java Apigee w systemie został zatrzymany |
Sprawdzanie portów związanych z Apigee i z usługami zewnętrznymi
Sprawdzaj te porty, aby mieć pewność, że są aktywne
- Port 4526, 4527 i 4528 na serwerze zarządzania, routerze i procesorze wiadomości
- Porty 1099, 1100 i 1101 na serwerze zarządzania, routerze i przetwarzaczu wiadomości
- Porty 8081 i 15999 na routerach
- Port 8082 i 8998 w procesorach komunikatów
- Port 8080 na serwerze zarządzania
Sprawdź, czy te porty innych firm są aktywne:
- Port Qpid 5672
- Port Postgres 5432
- Cassandra port 7000, 7199, 9042, 9160
- ZooKeeper port 2181
- Port OpenLDAP 10389
Aby określić, na którym porcie każdy komponent Apigee nasłuchuje wywołań interfejsu API, wykonaj następujące wywołania interfejsu API do serwera zarządzania (zazwyczaj na porcie 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
Wyniki tych poleceń będą zawierać sekcje podobne do pokazanej poniżej.
Sekcja http.management.port
zawiera numer portu do określonego komponentu.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Wyświetlanie logów
Pliki dziennika zawierają informacje o zdarzeniach i działaniach systemu. Wiadomości są wyświetlane w dzienniku po rozpoczęciu i zakończeniu procesów lub gdy wystąpi stan błędu. Dzięki wyświetlaniu plików dziennika możesz uzyskać informacje o komponentach systemu, takich jak procesor, pamięć, dysk, obciążenie czy procesy, przed i po wystąpieniu błędu. Pozwala to również identyfikować diagnozowanie źródeł bieżących problemów z systemem lub pomaga przewidywać potencjalne systemy .
Na przykład typowy dziennik systemowy komponentu zawiera takie wpisy:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Plik /opt/apigee/conf/logback.xml
możesz edytować, aby kontrolować mechanizm logowania bez
ponowne uruchomienie serwera. Plik logback.xml zawiera następującą właściwość, która ustawia
częstotliwość, z jaką mechanizm logowania sprawdza plik logback.xml pod kątem zmian konfiguracji:
<configuration scan="true" scanPeriod="30 seconds" >
Domyślnie mechanizm logowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu
do atrybutu scanPeriod
, domyślnie ustawiona jest wartość w milisekundach.
W tabeli poniżej znajdziesz lokalizację plików dziennika komponentów Apigee Edge Private Cloud.
Komponenty | Lokalizacja |
---|---|
Serwer zarządzania |
|
Router |
|
procesor komunikatów |
|
Qpid Server |
|
Serwer Apigee Postgres |
|
Interfejs Edge |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
Baza danych PostgreSQL |
|
Włączanie dzienników debugowania dla wiadomości Interfejs procesora i Edge
Aby włączyć dzienniki debugowania dla procesora wiadomości:
- W węźle Przetwarzanie wiadomości dokonaj edycji
/opt/apigee/customer/application/messsage-processor.properties
. Jeśli ten plik nie istnieje, należy go utworzyć. - Dodaj do pliku tę właściwość:
conf_system_log.level=DEBUG
- Ponownie uruchom procesor wiadomości:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Aby włączyć dzienniki debugowania interfejsu Edge:
- Edytuj
/opt/apigee/customer/application/ui.properties
w węźle Edge UI. Jeśli plik nie istnieje, utwórz go. - Dodaj do pliku tę właściwość:
conf_application_logger.application=DEBUG
- Ponownie uruchom interfejs Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
Sprawdzone metody dotyczące apigee-monit
Przy korzystaniu z apigee-monit
Apigee zaleca:
- Zatrzymaj monitorowanie komponentu, zanim go wykonasz która uruchamia lub zatrzymuje operację, np. tworzenie kopii zapasowej lub uaktualnienie.
- Monitoruj
apigee-monit
za pomocą takiego narzędzia jakcron
. Więcej Więcej informacji znajdziesz w artykule Monitorowanie apigee-monit.
Narzędzia do monitorowania
Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą Ci pomóc monitorowanie całego środowiska biznesowego i procesów biznesowych.
Komponent | Nagios | Zebrano | Splunk | |
---|---|---|---|---|
Sprawdzanie na poziomie systemu |
Wykorzystanie procesora |
|||
Wolna/wykorzystywana pamięć |
||||
Wykorzystanie miejsca na dysku |
||||
Statystyki sieci |
||||
Procesy |
|
|
||
Sprawdzanie interfejsu API |
||||
JMX |
||||
Java |
||||
Pliki dziennika |
||||
Zdarzenia krytyczne |
Osiągnięcie limitu szybkości |
|||
Nie można uzyskać dostępu do serwera backendu (Hybris lub SharePoint) |
||||
Brak dostępu do mechanizmu FaaS (STS) |
||||
zdarzenia ostrzegawczego |
Nie można nawiązać połączenia z serwerem SMTP |
|||
Naruszone gwarancje jakości usług |