Sprawdzone metody monitorowania

Edge for Private Cloud w wersji 4.18.01

Alerty monitorowania

Apigee Edge umożliwia przekazywanie alertów do syslog lub zewnętrznych systemów/narzędzi monitorowania, gdy wystąpi błąd lub awaria w wyniku niepowodzenia zdarzenia. Mogą to być alerty/zdarzenia na poziomie systemu lub aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe tworzone na podstawie wygenerowanych zdarzeń. Warunki niestandardowe konfiguruje zwykle administrator sieci. Aby uzyskać więcej informacji o alertach, skontaktuj się z zespołem pomocy Apigee.

Ustawianie progów alertów

Ustaw próg, po przekroczeniu którego ma zostać wygenerowany alert. Ustawienie zależy od konfiguracji sprzętu. Próg powinien być ustawiony odpowiednio do Twojego limitu. Na przykład Apigee Edge może być za mała, jeśli masz tylko 6 GB miejsca. Możesz przypisać próg z wartością kryterium (=) lub większą niż (>). Możesz też określić odstęp czasu między 2 kolejnymi generowaniemi alertów. Możesz użyć opcji godzin/minut/sekund.

Kryteria ustawiania alertów na poziomie systemu

Kryteria znajdziesz w tabeli poniżej:

Alert

Sugerowany próg

Opis

Mało pamięci

500MB

Za mało pamięci, aby uruchomić komponent

Mało miejsca na dysku (/var/log)

8 GB

Za mało miejsca na dysku.

Duże obciążenie

3+

Liczba procesów oczekujących na uruchomienie niespodziewanie wzrosła

Proces został zatrzymany

Nie dotyczy, wartość logiczna prawda lub fałsz

Proces Apigee Java w systemie został zatrzymany

Sprawdzam porty związane z Apigee i porty innych firm

Sprawdzaj te porty, aby upewnić się, że są aktywne

  • Porty 4526, 4527 i 4528 na serwerze zarządzania, routerze i procesorze wiadomości
  • Porty 1099, 1100 i 1101 na serwerze zarządzania, routerze i procesorze wiadomości
  • porty 8081 i 15999 w routerach,
  • porty 8082 i 8998 w procesorach wiadomości,
  • Port 8080 na serwerze zarządzania

Sprawdź te porty innych firm, aby upewnić się, że są aktywne:

  • Port Qpid 5672
  • Port 5432 Postgres
  • Cassandra port 7000, 7199, 9042, 9160
  • ZooKeeper port 2181
  • Port OpenLDAP 10389

Aby określić, na którym porcie każdy komponent Apigee nasłuchuje wywołań interfejsu API, wyślij te wywołania interfejsu API do serwera zarządzania (zwykle na porcie 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Dane wyjściowe tych poleceń będą zawierać sekcje podobne do tych, które pokazano poniżej. Sekcja „http.management.port” zawiera numer portu określonego komponentu.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Wyświetlanie logów

Pliki dzienników rejestrują komunikaty dotyczące zdarzenia lub działania systemu. Komunikaty pojawiają się w logu po rozpoczęciu i zakończeniu procesów lub po wystąpieniu warunku błędu. Dzięki wyświetlaniu plików logów możesz uzyskać informacje o komponentach systemu, takich jak procesor, pamięć, dysk, obciążenie czy procesy, a także przed wystąpieniem błędu i po nim. Dzięki temu możesz też identyfikować i diagnozować źródła bieżących problemów z systemem oraz przewidywać potencjalne problemy z systemem.

Na przykład typowy dziennik systemowy komponentu zawiera te wpisy:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Możesz edytować plik /opt/apigee/conf/logback.xml, aby kontrolować mechanizm logowania bez konieczności ponownego uruchamiania serwera. Plik logback.xml zawiera tę właściwość, która ustawia częstotliwość, z jaką mechanizm logowania sprawdza, czy w pliku logback.xml nie wprowadzono zmian konfiguracji:

<configuration scan="true" scanPeriod="30 seconds" >

Domyślnie mechanizm logowania sprawdza co minutę pod kątem zmian. Jeśli pominiesz jednostki czasu w atrybucie scanPeriod, przyjmuje on domyślnie wartość w milisekundach.

W poniższej tabeli znajdziesz informacje o lokalizacji plików dziennika komponentów Private Cloud Apigee Edge.

Komponenty

Lokalizacja

Serwer zarządzania

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

procesor komunikatów

opt/apigee/var/log/edge-message-processor

Serwer Qpid

opt/apigee/var/log/edge-qpid-server

Serwer Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Interfejs Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Baza danych PostgreSQL

opt/apigee/var/log/apigee-postgresql

Włączanie logów debugowania dla procesora wiadomości i interfejsu użytkownika Edge

Aby włączyć dzienniki debugowania dotyczące procesora wiadomości:

  1. W węźle procesora wiadomości edytuj plik /opt/apigee/customer/application/messsage-processor.properties. Jeśli taki plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_system_log.level=DEBUG
  3. Ponownie uruchom procesor wiadomości:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor restart

Aby włączyć dzienniki debugowania dla interfejsu Edge:

  1. W węźle interfejsu Edge edytuj /opt/apigee/customer/application/ui.properties. Jeśli taki plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_application_logger.application=DEBUG
  3. Ponownie uruchom interfejs Edge:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-ui restart

Narzędzia do monitorowania

Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą pomóc w monitorowaniu całego środowiska firmowego i procesów biznesowych.

Komponent

Nagios

Zebrano

Splunk

Kontrole na poziomie systemu

Wykorzystanie procesora

Wolna/wykorzystana pamięć

Wykorzystanie miejsca na dysku

Statystyki sieci

Procesy

Testy interfejsu API

JMX,

Java

Pliki dziennika

Zdarzenia krytyczne

Osiągnięto limit liczby żądań

Nie można nawiązać połączenia z serwerem backendu (Hybris lub SharePoint)

Brak dostępu do FaaS (STS)

zdarzenia ostrzegawczego

Brak połączenia z serwerem SMTP

Naruszenia gwarancji jakości usług