Sprawdzone metody monitorowania

Edge for Private Cloud w wersji 4.17.05

Alerty monitorowania

Apigee Edge umożliwia przekazywanie alertów do syslog lub zewnętrznych systemów/narzędzi monitorujących, gdy wystąpi błąd lub niepowodzenie z powodu niepowodzenia zdarzenia. Mogą to być alerty na poziomie systemu alertów/zdarzeń na poziomie aplikacji. Alerty na poziomie aplikacji to głównie alerty niestandardowe, tworzone na podstawie wygenerowanych zdarzeń. Niestandardowy administrator sieci zwykle konfiguruje warunków. Aby dowiedzieć się więcej o alertach, skontaktuj się z zespołem pomocy Apigee.

Ustawianie progów alertów

Ustaw próg, po którym musi zostać wygenerowany alert. Wartość, którą ustawisz, zależy od konfiguracji sprzętowej. Próg powinien być ustalany na podstawie wydajności. Na przykład Apigee Edge może być za niska, jeśli masz tylko 6 GB miejsca. Możesz przypisać próg z wartością (=), lub większe od (>). Możesz też określić przedział czasu między dwoma kolejnymi generowania alertów. Możesz użyć opcji godzin/minut/sekund.

Kryteria ustawiania alertów na poziomie systemu

Kryteria są opisane w tabeli poniżej:

Alert

Sugerowany próg

Opis

Mało pamięci

500MB

Za mało pamięci, aby uruchomić komponent

Mało miejsca na dysku (/var/log)

8 GB

Na dysku spadło za mało miejsca.

Duże obciążenie

3+

Liczba oczekujących na uruchomienie procesów nieoczekiwanie wzrosła

Proces zatrzymany

Nie dotyczy, wartość logiczna prawda lub fałsz

Proces Java Apigee w systemie został zatrzymany

Sprawdzam możliwości specyficzne dla Apigee i aplikacji innych firm Porty

Sprawdzaj te porty, aby mieć pewność, że są aktywne

  • Port 4526, 4527 i 4528 na serwerze zarządzania, routerze i procesorze wiadomości
  • Port 1099, 1100 i 1101 na serwerze zarządzania, routerze i procesorze wiadomości
  • Port 8081 i 15999 w routerach
  • Port 8082 i 8998 w procesorach komunikatów

Port 8080 na serwerze zarządzania. Sprawdź poniższe porty innych firm, aby się upewnić są aktywne:

  • Port Qpid 5672
  • Port Postgres 5432
  • Cassandra port 7000, 7199, 9042, 9160
  • ZooKeeper port 2181
  • Port 10389 OpenLDAP

Aby określić, na którym porcie każdy komponent Apigee nasłuchuje wywołań interfejsu API, wykonaj następujące wywołania interfejsu API do serwera zarządzania (zazwyczaj na porcie 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Wyniki tych poleceń będą zawierać sekcje podobne do pokazanej poniżej. &quot;http.management.port&quot; (sekcja) podaje numer portu określonego komponentu.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Wyświetlanie logów

Pliki dziennika przechowują komunikaty dotyczące zdarzeń i działań systemu. Wiadomości są wyświetlane w dzienniku po rozpoczęciu i zakończeniu procesów lub gdy wystąpi stan błędu. Wyświetlając dziennik można uzyskać informacje o składnikach systemu, takich jak CPU, pamięć, dysk, obciążenie przed i po wystąpieniu błędu. Pozwala to również identyfikować diagnozowanie źródeł bieżących problemów z systemem lub pomaga przewidywać potencjalne systemy .

Na przykład typowy dziennik systemowy komponentu zawiera takie wpisy:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Możesz edytować plik /opt/apigee/conf/logback.xml, aby kontrolować mechanizm logowania bez ponowne uruchomienie serwera. Plik logback.xml zawiera następującą właściwość, która ustawia częstotliwość, z jaką mechanizm logowania sprawdza plik logback.xml pod kątem zmian konfiguracji:

<configuration scan="true" scanPeriod="30 seconds" >

Domyślnie mechanizm logowania sprawdza zmiany co minutę. Jeśli pominiesz jednostki czasu do atrybutu scanPeriod, domyślna wartość w milisekundach.

W tabeli poniżej znajdziesz lokalizację plików logów komponentów Apigee Edge Private Cloud.

Komponenty

Lokalizacja

Serwer zarządzania

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

procesor komunikatów

opt/apigee/var/log/edge-message-processor

Serwer Qpid

opt/apigee/var/log/edge-qpid-server

Serwer Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Interfejs Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Baza danych PostgreSQL

opt/apigee/var/log/apigee-postgresql

Włączanie dzienników debugowania dla wiadomości Interfejs procesora i Edge

Aby włączyć dzienniki debugowania dla procesora wiadomości:

  1. W węźle Message Processor edytuj /opt/apigee/customer/application/messsage-processor.properties. Jeśli plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_system_log.level=DEBUG
  3. Uruchom ponownie procesor wiadomości:
    &gt; /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Aby włączyć dzienniki debugowania dla interfejsu Edge:

  1. W węźle interfejsu Edge edytuj /opt/apigee/customer/application/ui.properties. Jeśli plik nie istnieje, utwórz go.
  2. Dodaj do pliku tę właściwość:
    conf_application_logger.application=DEBUG
  3. Uruchom ponownie interfejs Edge:
    &gt; /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Narzędzia monitorujące

Narzędzia monitorujące, takie jak Nagios, Collectd, Graphite, Splunk, Sumologic i Monit, mogą Ci pomóc monitorowanie całego środowiska biznesowego i procesów biznesowych.

Komponent

Nagios

Zebrano

Splunk

Kontrole na poziomie systemu

Wykorzystanie procesora

?

?

Wolna/wykorzystywana pamięć

?

?

Wykorzystanie miejsca na dysku

?

?

Statystyki sieci

?

?

Procesy

?

Testy interfejsu API

?

JMX

?

Java

?

Pliki dziennika

?

Zdarzenia krytyczne

Osiągnięcie limitu szybkości

?

Nie można uzyskać dostępu do serwera backendu (Hybris lub SharePoint)

?

Brak dostępu do mechanizmu FaaS (STS)

?

zdarzenia ostrzegawczego

Nie można nawiązać połączenia z serwerem SMTP

?

Naruszone gwarancja jakości usług

?