Sprawdzone metody monitorowania

Alerty monitorowania

Apigee Edge umożliwia przekierowywanie alertów do syslogów lub zewnętrznych systemów/narzędzi monitorujących, gdy wystąpi błąd lub awaria z powodu błędu zdarzenia. Mogą to być alerty/zdarzenia na poziomie systemu lub aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe tworzone na podstawie generowanych zdarzeń. Zwykle administrator sieci konfiguruje warunki niestandardowe. Aby uzyskać więcej informacji o alertach, skontaktuj się z zespołem pomocy Apigee.

Ustawianie progów alertów

Ustaw próg, po przekroczeniu którego ma być generowany alert. Ustawienia zależą od konfiguracji sprzętu. Próg powinien być ustawiony w zależności od Twojej pojemności. Na przykład w przypadku Apigee Edge może być zbyt mała, jeśli masz tylko 6 GB pojemności. Możesz przypisać próg za pomocą kryterium równe (=) lub większe (>). Możesz też określić przedział czasu między kolejnymi generowaniami alertów. Możesz użyć opcji godzin/minut/sekund.

Kryteria ustawiania alertów na poziomie systemu

Tabela poniżej zawiera opis kryteriów:

Alert Sugerowany próg Opis

Mało pamięci

500 MB

Za mało pamięci na uruchomienie komponentu

Mało miejsca na dysku (/var/log)

8 GB

Za mało miejsca na dysku.

Wysokie obciążenie

3+

Nieoczekiwanie zwiększyła się liczba procesów oczekujących na uruchomienie

Proces został zatrzymany

Nie dotyczy, wartość logiczna (prawda lub fałsz)

Proces Apigee Java w systemie został zatrzymany

Sprawdzanie portów związanych z Apigee i z usługami zewnętrznymi

Sprawdź, czy te porty są aktywne

  • Porty 4526, 4527 i 4528 na serwerze zarządzania, routerze i przetwarzaczu wiadomości
  • Porty 1099, 1100 i 1101 na serwerze zarządzania, routerze i przetwarzaczu wiadomości
  • Porty 8081 i 15999 na routerach
  • Porty 8082 i 8998 na procesorach komunikatów
  • Port 8080 na serwerze zarządzania

Sprawdź, czy te porty firm zewnętrznych są aktywne:

  • Port Qpid 5672
  • Port Postgres 5432
  • Port Cassandra 7000, 7199, 9042, 9160
  • Port ZooKeeper 2181
  • Port OpenLDAP 10389

Aby określić, na którym porcie dany komponent Apigee nasłuchuje wywołań interfejsu API, wykonaj te wywołania interfejsu API do serwera zarządzania (który zwykle znajduje się na porcie 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

Dane wyjściowe tych poleceń będą zawierać sekcje podobne do tej poniżej. W sekcji http.management.port podany jest numer portu określonego komponentu.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Wyświetlanie logów

Pliki dziennika zawierają informacje o zdarzeniach i działaniach systemu. Komunikaty pojawiają się w logu, gdy procesy się zaczynają i kończą lub gdy wystąpi błąd. Dzięki wyświetlaniu plików dziennika możesz uzyskać informacje o komponentach systemu, takich jak procesor, pamięć, dysk, obciążenie czy procesy, przed i po wystąpieniu błędu. Dzięki temu możesz też zidentyfikować i zdiagnozować źródło bieżących problemów z systemem lub przewidzieć potencjalne problemy z systemem.

Przykładowy dziennik systemowy komponentu zawiera te wpisy:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Możesz edytować plik /opt/apigee/conf/logback.xml, aby kontrolować mechanizm rejestrowania bez konieczności restartowania serwera. Plik logback.xml zawiera tę właściwość, która określa częstotliwość sprawdzania przez mechanizm rejestrowania zmian w pliku logback.xml:

<configuration scan="true" scanPeriod="30 seconds" >

Domyślnie mechanizm rejestrowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu w atrybucie scanPeriod, zostaną one domyślnie ustawione na milisekundy.

W tabeli poniżej podano lokalizację plików dziennika komponentów Apigee Edge Private Cloud.

Komponenty Lokalizacja

Serwer zarządzania

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

procesor komunikatów

opt/apigee/var/log/edge-message-processor

Qpid Server

opt/apigee/var/log/edge-qpid-server

Serwer Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Interfejs Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Baza danych PostgreSQL

opt/apigee/var/log/apigee-postgresql

Włączanie dzienników debugowania w przypadku procesora wiadomości i interfejsu Edge

Aby włączyć dzienniki debugowania dla usługi Message Processor:

  1. W węźle Procesor wiadomości dokonaj edycji:/opt/apigee/customer/application/messsage-processor.properties. Jeśli plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_system_log.level=DEBUG
  3. Ponownie uruchom przetwarzacz wiadomości:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Aby włączyć dzienniki debugowania interfejsu Edge:

  1. W węźle interfejsu Edge edytuj /opt/apigee/customer/application/ui.properties. Jeśli plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_application_logger.application=DEBUG
  3. Ponownie uruchom interfejs Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

apigee-monit sprawdzone metody

Podczas korzystania z apigee-monit Apigee zaleca:

Narzędzia do monitorowania

Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą pomóc w monitorowaniu całego środowiska korporacyjnego i procesów biznesowych.

Komponent Nagios Collectd Splunk

Sprawdzanie na poziomie systemu

Wykorzystanie procesora

Wolna/wykorzystana pamięć

Wykorzystanie miejsca na dysku

Statystyki sieci

Procesy

Sprawdzanie interfejsu API

JMX

Java

Pliki dziennika

Krytyczne zdarzenia

Ograniczenie liczby żądań

Brak połączenia z serwerem backendu (Hybris lub SharePoint)

Nie można uzyskać dostępu do FaaS (STS)

zdarzenia ostrzegawczego

Nie można połączyć się z serwerem SMTP

Naruszone gwarancje jakości usług