Sprawdzone metody monitorowania

Edge for Private Cloud w wersji 4.18.05

Alerty monitorowania

Apigee Edge umożliwia przekazywanie alertów do syslog lub zewnętrznych systemów/narzędzi monitorujących, gdy wystąpi błąd lub niepowodzenie z powodu niepowodzenia zdarzenia. Mogą to być alerty na poziomie systemu alertów/zdarzeń na poziomie aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe, tworzone na podstawie wygenerowanych zdarzeń. Niestandardowy administrator sieci zwykle konfiguruje warunków. Aby dowiedzieć się więcej o alertach, skontaktuj się z zespołem pomocy Apigee.

Ustawianie progów alertów

Ustaw próg, po którym musi zostać wygenerowany alert. Wartość, którą ustawisz, zależy od konfiguracji sprzętowej. Próg powinien być ustalany na podstawie wydajności. Na przykład Apigee Edge może być za niska, jeśli masz tylko 6 GB miejsca. Możesz przypisać próg z wartością (=), lub większe od (>). Możesz też określić przedział czasu między dwoma kolejnymi generowania alertów. Możesz użyć opcji godzin/minut/sekund.

Kryteria ustawiania alertów na poziomie systemu

Kryteria są opisane w tabeli poniżej:

Alert Sugerowany próg Opis

Mało pamięci

500MB

Za mało pamięci, aby uruchomić komponent

Mało miejsca na dysku (/var/log)

8 GB

Na dysku spadło za mało miejsca.

Duże obciążenie

3+

Liczba oczekujących na uruchomienie procesów nieoczekiwanie wzrosła

Proces zatrzymany

Nie dotyczy, wartość logiczna prawda lub fałsz

Proces Java Apigee w systemie został zatrzymany

Sprawdzam możliwości specyficzne dla Apigee i aplikacji innych firm Porty

Sprawdzaj te porty, aby mieć pewność, że są aktywne

  • Port 4526, 4527 i 4528 na serwerze zarządzania, routerze i procesorze wiadomości
  • Port 1099, 1100 i 1101 na serwerze zarządzania, routerze i procesorze wiadomości
  • Port 8081 i 15999 w routerach
  • Port 8082 i 8998 w procesorach komunikatów
  • Port 8080 na serwerze zarządzania

Sprawdź, czy te porty innych firm są aktywne:

  • Port Qpid 5672
  • Port Postgres 5432
  • Cassandra port 7000, 7199, 9042, 9160
  • ZooKeeper port 2181
  • Port 10389 OpenLDAP

Aby określić, na którym porcie każdy komponent Apigee nasłuchuje wywołań interfejsu API, wykonaj następujące wywołania interfejsu API do serwera zarządzania (zazwyczaj na porcie 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

Wyniki tych poleceń będą zawierać sekcje podobne do pokazanej poniżej. Sekcja http.management.port zawiera numer portu do określonego komponentu.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Wyświetlanie logów

Pliki dziennika przechowują komunikaty dotyczące zdarzeń i działań systemu. Wiadomości są wyświetlane w dzienniku po rozpoczęciu i zakończeniu procesów lub gdy wystąpi stan błędu. Wyświetlając dziennik można uzyskać informacje o składnikach systemu, takich jak CPU, pamięć, dysk, obciążenie przed i po wystąpieniu błędu. Pozwala to również identyfikować diagnozowanie źródeł bieżących problemów z systemem lub pomaga przewidywać potencjalne systemy .

Na przykład typowy dziennik systemowy komponentu zawiera takie wpisy:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Plik /opt/apigee/conf/logback.xml możesz edytować, aby kontrolować mechanizm logowania bez ponowne uruchomienie serwera. Plik logback.xml zawiera następującą właściwość, która ustawia częstotliwość, z jaką mechanizm logowania sprawdza plik logback.xml pod kątem zmian konfiguracji:

<configuration scan="true" scanPeriod="30 seconds" >

Domyślnie mechanizm logowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu do atrybutu scanPeriod, domyślnie ustawiona jest wartość w milisekundach.

W tabeli poniżej znajdziesz lokalizację plików logów komponentów Apigee Edge Private Cloud.

Komponenty Lokalizacja

Serwer zarządzania

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

procesor komunikatów

opt/apigee/var/log/edge-message-processor

Serwer Qpid

opt/apigee/var/log/edge-qpid-server

Serwer Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Interfejs Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Baza danych PostgreSQL

opt/apigee/var/log/apigee-postgresql

Włączanie dzienników debugowania dla wiadomości Interfejs procesora i Edge

Aby włączyć dzienniki debugowania dla procesora wiadomości:

  1. W węźle procesora wiadomości edytuj /opt/apigee/customer/application/messsage-processor.properties Jeśli ten plik nie istnieje, należy go utworzyć.
  2. Dodaj do pliku tę właściwość:
    conf_system_log.level=DEBUG
  3. Ponownie uruchom procesor wiadomości:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Aby włączyć dzienniki debugowania dla interfejsu Edge:

  1. Edytuj /opt/apigee/customer/application/ui.properties w węźle Edge UI. Jeśli plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_application_logger.application=DEBUG
  3. Ponownie uruchom interfejs Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Narzędzia monitorujące

Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą Ci pomóc monitorowanie całego środowiska biznesowego i procesów biznesowych.

Komponent Nagios Zebrano Splunk

Kontrole na poziomie systemu

Wykorzystanie procesora

Wolna/wykorzystywana pamięć

Wykorzystanie miejsca na dysku

Statystyki sieci

Procesy

Testy interfejsu API

JMX

Java

Pliki dziennika

Zdarzenia krytyczne

Osiągnięcie limitu szybkości

Nie można uzyskać dostępu do serwera backendu (Hybris lub SharePoint)

Brak dostępu do mechanizmu FaaS (STS)

zdarzenia ostrzegawczego

Nie można nawiązać połączenia z serwerem SMTP

Naruszone gwarancje jakości usług