Best Practices für das Monitoring

Monitoringbenachrichtigungen

Mit Apigee Edge können Sie Benachrichtigungen an Protokolle oder externe Überwachungssysteme/-tools weiterleiten, wenn ein Fehler oder Ausfall aufgrund eines fehlgeschlagenen Ereignisses auftritt. Diese Warnungen können auf Systemebene Warnungen/Ereignissen auf Anwendungsebene. Benachrichtigungen auf Anwendungsebene sind meist benutzerdefinierte Benachrichtigungen, basierend auf den generierten Ereignissen erstellt. Normalerweise konfiguriert der Netzwerkadministrator die benutzerdefinierte . Weitere Informationen zu Benachrichtigungen erhalten Sie vom Apigee-Support.

Benachrichtigungsgrenzwerte festlegen

Legen Sie einen Grenzwert fest, nach dem eine Benachrichtigung generiert werden muss. Was Sie festlegen, hängt davon ab, Hardwarekonfiguration. Der Grenzwert sollte in Relation zu Ihrer Kapazität festgelegt werden. Beispiel: Apigee Edge ist möglicherweise zu niedrig, wenn Sie nur 6 GB Kapazität haben. Sie können einen Grenzwert mit dem Wert (=) zuweisen oder größer als (>) ist. Sie können auch ein Zeitintervall zwischen zwei aufeinanderfolgenden Benachrichtigungen angeben. Sie können die Option „Stunden/Minuten/Sekunden“ verwenden.

Kriterien für die Einstellung von Benachrichtigungen auf Systemebene

In der folgenden Tabelle werden die Kriterien beschrieben:

Benachrichtigung Vorgeschlagener Grenzwert Beschreibung

Wenig Arbeitsspeicher

500 MB

Der Arbeitsspeicher ist zu gering, um eine Komponente zu starten

Wenig Speicherplatz (/var/log)

8 GB

Der Speicherplatz ist zu gering.

Hohe Last

3+

Die Anzahl der ausstehenden Prozesse ist unerwartet gestiegen

Prozess angehalten

Der boolesche Wert „wahr“ oder „falsch“

Apigee-Java-Prozess im System wurde beendet

Apigee-spezifische und Drittanbieter-Abfragen prüfen Anschlüsse

Überprüfen Sie die folgenden Ports, um sicherzustellen, dass sie aktiv sind

  • Port 4526, 4527 und 4528 auf dem Verwaltungsserver, dem Router und dem Message Processor
  • Port 1099, 1100 und 1101 auf dem Verwaltungsserver, dem Router und dem Message Processor
  • Port 8081 und 15999 bei Routern
  • Port 8082 und 8998 in Message Processor
  • Port 8080 auf dem Verwaltungsserver

Prüfen Sie, ob die folgenden Drittanbieterports aktiv sind:

  • QPID-Port 5672
  • Postgres-Port 5432
  • Cassandra-Port 7000, 7199, 9042, 9160
  • ZooKeeper Port 2181
  • OpenLDAP-Port 10389

Um zu ermitteln, auf welchem Port jede Apigee-Komponente auf API-Aufrufe wartet, führen Sie die folgenden API-Aufrufe an den Verwaltungsserver aus (der sich in der Regel auf Port 8080 befindet):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

Die Ausgabe dieser Befehle enthält ähnliche Abschnitte wie die unten gezeigten. Die Der Abschnitt http.management.port gibt die Portnummer für die angegebene Komponente an.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Logs ansehen

In Protokolldateien werden Meldungen über das Ereignis/den Betrieb des Systems festgehalten. Nachrichten werden angezeigt im Protokoll, wenn Prozesse beginnen und abgeschlossen werden oder wenn eine Fehlerbedingung auftritt. In Protokolldateien finden Sie Informationen zu Systemkomponenten wie CPU, Arbeitsspeicher, Festplatte, Auslastung und Prozessen vor und nach dem Auftreten eines Fehlers. So können Sie auch die Ursache aktueller Systemprobleme ermitteln und diagnostizieren oder potenzielle Systemprobleme vorhersagen.

Ein typisches Systemprotokoll einer Komponente enthält beispielsweise die folgenden Einträge:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Sie können die Datei /opt/apigee/conf/logback.xml bearbeiten, um den Protokollierungsmechanismus zu steuern, ohne einen Server neu starten zu müssen. Die Datei logback.xml enthält die folgende Eigenschaft, die den Parameter Häufigkeit, mit der der Logging-Mechanismus die Datei logback.xml auf Konfigurationsänderungen prüft:

<configuration scan="true" scanPeriod="30 seconds" >

Standardmäßig prüft der Logging-Mechanismus minütlich auf Änderungen. Wenn Sie die Zeiteinheiten für das scanPeriod-Attribut weglassen, wird standardmäßig „Millisekunden“ verwendet.

In der folgenden Tabelle finden Sie den Speicherort der Protokolldateien der Apigee Edge Private Cloud-Komponenten.

Komponenten Standort

Verwaltungsserver

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Message Processor

opt/apigee/var/log/edge-message-processor

QPID-Server

opt/apigee/var/log/edge-qpid-server

Apigee Postgres-Server

opt/apigee/var/log/edge-postgres-server

Edge-Benutzeroberfläche

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

PostgreSQL-Datenbank

opt/apigee/var/log/apigee-postgresql

Fehlerbehebungsprotokolle für die Nachricht aktivieren Prozessor- und Edge-Benutzeroberfläche

So aktivieren Sie Debug-Logs für den Nachrichtenverarbeiter:

  1. Bearbeiten Sie im Message Processor-Knoten /opt/apigee/customer/application/messsage-processor.properties Wenn dies der Fall ist, nicht vorhanden ist, erstellen Sie es.
  2. Fügen Sie der Datei die folgende Eigenschaft hinzu:
    conf_system_log.level=DEBUG
  3. Starten Sie den Message Processor neu:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

So aktivieren Sie Fehlerbehebungsprotokolle für die Edge-Benutzeroberfläche:

  1. Bearbeiten Sie /opt/apigee/customer/application/ui.properties im Edge-Benutzeroberflächenknoten. Sollte die Datei nicht vorhanden sein, erstellen Sie sie.
  2. Fügen Sie der Datei die folgende Eigenschaft hinzu:
    conf_application_logger.application=DEBUG
  3. Starten Sie die Edge-Benutzeroberfläche neu:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Apigee-Monit Best Practices

Bei der Verwendung von apigee-monit empfiehlt Apigee Folgendes:

Überwachungstools

Monitoring-Tools wie Nagios, Collectd, Graphite, Splunk, Sumologic und Monit können Ihnen dabei helfen, Ihre gesamte Unternehmensumgebung und Geschäftsprozesse überwachen.

Komponente Nagios Collectd Splunk

Prüfungen auf Systemebene

CPU-Auslastung

Kostenloser/verwendeter Arbeitsspeicher

Speicherplatznutzung

Netzwerkstatistik

Prozesse

API-Prüfungen

JMX

Java

Protokolldateien

Kritische Ereignisse

Ratenbegrenzung erreicht

Backend-Server (Hybris oder SharePoint) ist nicht erreichbar

FaaS (STS) ist nicht erreichbar

Ereignis vom Typ „Warnung“

SMTP-Server ist nicht erreichbar

SLAs, gegen die verstoßen wurde