Best Practices für das Monitoring

Edge for Private Cloud Version 4.18.01

Monitoringbenachrichtigungen

Mit Apigee Edge können Sie Benachrichtigungen an Systemlogs oder externe Monitoringsysteme/Tools weiterleiten, wenn aufgrund eines Ereignisfehlers ein Fehler oder ein Fehler auftritt. Bei diesen Benachrichtigungen kann es sich um Benachrichtigungen/Ereignisse auf System- oder Anwendungsebene handeln. Benachrichtigungen auf Anwendungsebene sind meist benutzerdefinierte Benachrichtigungen, die anhand von generierten Ereignissen erstellt werden. In der Regel konfiguriert der Netzwerkadministrator die benutzerdefinierten Bedingungen. Weitere Informationen zu Benachrichtigungen erhalten Sie vom Apigee-Support.

Grenzwerte für Benachrichtigungen festlegen

Legen Sie einen Schwellenwert fest, ab dem eine Benachrichtigung generiert werden muss. Was Sie festlegen, hängt von Ihrer Hardwarekonfiguration ab. Der Schwellenwert sollte in Bezug auf Ihre Kapazität festgelegt werden. Beispielsweise könnte Apigee Edge zu niedrig sein, wenn Sie nur 6 GB Kapazität haben. Sie können einen Grenzwert zuweisen, der dem Kriterium gleich (=) oder größer als (>) entspricht. Sie können auch ein Zeitintervall zwischen zwei aufeinanderfolgenden Generierungen von Benachrichtigungen angeben. Sie können die Option für Stunden/Minuten/Sekunden verwenden.

Kriterien für die Einrichtung von Benachrichtigungen auf Systemebene

In der folgenden Tabelle werden die Kriterien beschrieben:

Benachrichtigung

Vorgeschlagener Grenzwert

Beschreibung

Wenig Arbeitsspeicher

500 MB

Der Arbeitsspeicher ist zu gering, um eine Komponente zu starten

Wenig Speicherplatz (/var/log)

8 GB

Es ist zu wenig Speicherplatz vorhanden.

Hohe Last

3+

Prozesse, die noch ausgeführt werden müssen, haben unerwartet zugenommen

Prozess beendet

Nicht zutreffend, boolescher Wert „wahr“ oder „falsch“

Apigee-Java-Prozess im System wurde beendet

Apigee-spezifische und externe Ports prüfen

Prüfen Sie die folgenden Ports, um sicherzustellen, dass sie aktiv sind

  • Port 4526, 4527 und 4528 auf dem Verwaltungsserver, dem Router und dem Message Processor
  • Port 1099, 1100 und 1101 auf dem Verwaltungsserver, dem Router und dem Message Processor
  • Port 8081 und 15999 bei Routern
  • Port 8082 und 8998 auf Message Processorn
  • Port 8080 auf dem Verwaltungsserver

Prüfen Sie, ob die folgenden Drittanbieter-Ports aktiv sind:

  • Qpid-Port 5672
  • Postgres-Port 5432
  • Cassandra-Port 7000, 7199, 9042, 9160
  • ZooKeeper-Port 2181
  • OpenLDAP-Port 10389

Um zu ermitteln, welchen Port die einzelnen Apigee-Komponenten auf API-Aufrufe überwachen, führen Sie die folgenden API-Aufrufe an den Verwaltungsserver aus, der sich in der Regel auf Port 8080 befindet:

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Die Ausgabe dieser Befehle enthält Abschnitte ähnlich den unten gezeigten. Im Abschnitt http.management.port ist die Portnummer für die angegebene Komponente angegeben.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Logs ansehen

Protokolldateien enthalten Informationen zu Ereignissen bzw. zum Betrieb des Systems. Meldungen werden im Log angezeigt, wenn Prozesse beginnen und abgeschlossen werden oder wenn ein Fehler auftritt. Durch das Aufrufen von Logdateien können Sie Informationen zu Systemkomponenten wie CPU, Arbeitsspeicher, Laufwerk, Last, Prozessen usw. vor und nach dem Auftreten eines Fehlerstatus abrufen. So können Sie auch die Ursache aktueller Systemprobleme identifizieren und diagnostizieren oder potenzielle Systemprobleme vorhersagen.

Ein typisches Systemprotokoll einer Komponente enthält beispielsweise die folgenden Einträge:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Sie können die Datei /opt/apigee/conf/logback.xml bearbeiten, um den Logging-Mechanismus zu steuern, ohne einen Server neu starten zu müssen. Die Datei logback.xml enthält die folgende Eigenschaft, die die Häufigkeit festlegt, mit der der Protokollierungsmechanismus die Datei logback.xml auf Konfigurationsänderungen prüft:

<configuration scan="true" scanPeriod="30 seconds" >

Standardmäßig sucht der Logging-Mechanismus jede Minute auf Änderungen. Wenn Sie die Zeiteinheiten im scanPeriod-Attribut weglassen, werden standardmäßig Millisekunden verwendet.

In der folgenden Tabelle wird der Speicherort der Protokolldateien von Apigee Edge Private Cloud-Komponenten angegeben.

Komponenten

Standort

Verwaltungsserver

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Message Processor

opt/apigee/var/log/edge-message-processor

Qpid-Server

opt/apigee/var/log/edge-qpid-server

Apigee Postgres-Server

opt/apigee/var/log/edge-postgres-server

Edge-Benutzeroberfläche

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

PostgreSQL-Datenbank

opt/apigee/var/log/apigee-postgresql

Fehlerbehebungsprotokolle für den Message Processor und die Edge-Benutzeroberfläche aktivieren

So aktivieren Sie Fehlerbehebungsprotokolle für Message Processor:

  1. Bearbeiten Sie auf dem Message Processor-Knoten /opt/apigee/customer/application/messsage-processor.properties. Wenn diese Datei nicht vorhanden ist, erstellen Sie sie.
  2. Fügen Sie der Datei das folgende Attribut hinzu:
    conf_system_log.level=DEBUG
  3. Starten Sie den Meldungsprozessor neu:
    > /opt/apigee/apigee-service/bin/apigee-service-Edge-Message-processor-Neustart

So aktivieren Sie Fehlerbehebungsprotokolle für die Edge-Benutzeroberfläche:

  1. Bearbeiten Sie auf dem Edge-UI-Knoten /opt/apigee/customer/application/ui.properties. Wenn diese Datei nicht vorhanden ist, erstellen Sie sie.
  2. Fügen Sie der Datei das folgende Attribut hinzu:
    conf_application_logger.application=DEBUG
  3. Starten Sie die Edge-Benutzeroberfläche neu:
    > /opt/apigee/apigee-service/bin/apigee-service-Edge-ui-Neustart

Monitoringtools

Monitoringtools wie Nagios, Collectd, Graphite, Splunk, Sumologic und Monit können Ihnen helfen, Ihre gesamte Unternehmensumgebung und Ihre gesamten Geschäftsprozesse zu überwachen.

Komponente

Nagios

Gesammelt

Splunk

Prüfungen auf Systemebene

CPU-Auslastung

Kostenloser/genutzter Arbeitsspeicher

Speicherplatznutzung

Netzwerkstatistik

Prozesse

API-Prüfungen

JMX

Java

Protokolldateien

Kritische Ereignisse

Ratenbegrenzung erreicht

Back-End-Server (Hybris oder SharePoint) ist nicht erreichbar

FaaS (STS) ist nicht erreichbar

Ereignis vom Typ „Warnung“

Der SMTP-Server ist nicht erreichbar.

Verstoß gegen das SLA