Best Practices für das Monitoring

Edge for Private Cloud Version 4.17.09

Monitoringbenachrichtigungen

Mit Apigee Edge können Sie Benachrichtigungen an Syslogs oder externe Überwachungssysteme/Tools weiterleiten, wenn Fehler oder ein Versagen aufgrund des Ausfalls eines Ereignisses auftritt. Diese Warnungen können auf Systemebene Warnungen/Ereignissen auf Anwendungsebene. Benachrichtigungen auf Anwendungsebene sind meist benutzerdefinierte Benachrichtigungen, basierend auf den generierten Ereignissen erstellt. Normalerweise konfiguriert der Netzwerkadministrator die benutzerdefinierte . Weitere Informationen zu Benachrichtigungen erhalten Sie vom Apigee-Support.

Benachrichtigungsgrenzwerte festlegen

Legen Sie einen Grenzwert fest, nach dem eine Benachrichtigung generiert werden muss. Was Sie festlegen, hängt davon ab, Hardwarekonfiguration. Der Grenzwert sollte in Relation zu Ihrer Kapazität festgelegt werden. Beispiel: Apigee Edge ist möglicherweise zu niedrig, wenn Sie nur 6 GB Kapazität haben. Sie können einen Grenzwert mit dem Wert (=) zuweisen oder größer als (>) ist. Sie können auch ein Zeitintervall zwischen zwei aufeinanderfolgenden das Generieren von Benachrichtigungen. Sie können die Option für Stunden/Minuten/Sekunden verwenden.

Kriterien für die Einstellung von Benachrichtigungen auf Systemebene

In der folgenden Tabelle werden die Kriterien beschrieben:

Benachrichtigung

Vorgeschlagener Grenzwert

Beschreibung

Geringer Arbeitsspeicher

500 MB

Der Arbeitsspeicher ist zu gering, um eine Komponente zu starten

Wenig Speicherplatz (/var/log)

8 GB

Der Speicherplatz ist zu gering.

Hohe Last

3+

Prozesse, die auf Ausführung warten, haben unerwartet zugenommen

Prozess angehalten

Der boolesche Wert „wahr“ oder „falsch“

Apigee-Java-Prozess im System wurde beendet

Apigee-spezifische und Drittanbieter-Abfragen prüfen Anschlüsse

Überprüfen Sie die folgenden Ports, um sicherzustellen, dass sie aktiv sind

  • Port 4526, 4527 und 4528 auf dem Verwaltungsserver, dem Router und dem Message Processor
  • Port 1099, 1100 und 1101 auf dem Verwaltungsserver, dem Router und dem Message Processor
  • Port 8081 und 15999 bei Routern
  • Port 8082 und 8998 in Message Processor
  • Port 8080 auf dem Verwaltungsserver

Prüfen Sie, ob die folgenden Drittanbieterports aktiv sind:

  • QPID-Port 5672
  • Postgres-Port 5432
  • Cassandra-Port 7000, 7199, 9042, 9160
  • ZooKeeper Port 2181
  • OpenLDAP-Port 10389

Um zu ermitteln, über welchen Port die einzelnen Apigee-Komponenten API-Aufrufe überwachen, geben Sie Folgendes ein: die folgenden API-Aufrufe an den Verwaltungsserver, der sich normalerweise am Port 8080 befindet:

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Die Ausgabe dieser Befehle enthält ähnliche Abschnitte wie die unten gezeigten. Die &quot;http.management.port&quot; Abschnitt gibt die Portnummer für die angegebene Komponente an.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Logs ansehen

In Protokolldateien werden Meldungen über das Ereignis/den Betrieb des Systems festgehalten. Nachrichten werden angezeigt im Protokoll, wenn Prozesse beginnen und abgeschlossen werden oder wenn eine Fehlerbedingung auftritt. Durch Aufrufen des Protokolls -Dateien können Sie Informationen zu Systemkomponenten abrufen, z. B. CPU, Arbeitsspeicher, Laufwerk, Last, Prozessen usw. vor und nach dem Erreichen des Status "Fehlgeschlagen". So können Sie auch die die Ursache aktueller Systemprobleme diagnostizieren oder ein potenzielles System vorhersagen Probleme.

Ein typisches Systemprotokoll einer Komponente enthält beispielsweise die folgenden Einträge:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Sie können die Datei /opt/apigee/conf/logback.xml bearbeiten, um den Protokollierungsmechanismus zu steuern, ohne einen Server neu starten zu müssen. Die Datei logback.xml enthält die folgende Eigenschaft, die den Parameter Häufigkeit, mit der der Logging-Mechanismus die Datei logback.xml auf Konfigurationsänderungen prüft:

<configuration scan="true" scanPeriod="30 seconds" >

Standardmäßig prüft der Logging-Mechanismus minütlich auf Änderungen. Wenn Sie die Zeiteinheiten scanPeriod hinzufügen, wird sie standardmäßig auf Millisekunden eingestellt.

In der folgenden Tabelle ist der Speicherort der Protokolldateien von Apigee Edge Private Cloud-Komponenten aufgeführt.

Komponenten

Standort

Verwaltungsserver

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Message Processor

opt/apigee/var/log/edge-message-processor

QPID-Server

opt/apigee/var/log/edge-qpid-server

Apigee Postgres-Server

opt/apigee/var/log/edge-postgres-server

Edge-Benutzeroberfläche

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

QPID

opt/apigee/var/log/apigee-qpidd

PostgreSQL-Datenbank

opt/apigee/var/log/apigee-postgresql

Fehlerbehebungsprotokolle für die Nachricht aktivieren Prozessor- und Edge-Benutzeroberfläche

So aktivieren Sie Fehlerbehebungsprotokolle für Message Processor:

  1. Bearbeiten Sie auf dem Message Processor-Knoten /opt/apigee/customer/application/messsage-processor.properties. Sollte die Datei nicht vorhanden sein, erstellen Sie sie.
  2. Fügen Sie der Datei das folgende Attribut hinzu:
    conf_system_log.level=DEBUG
  3. Starten Sie den Message Processor neu:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor neustart

So aktivieren Sie Fehlerbehebungsprotokolle für die Edge-Benutzeroberfläche:

  1. Bearbeiten Sie im Edge-Benutzeroberflächenknoten /opt/apigee/customer/application/ui.properties. Sollte die Datei nicht vorhanden sein, erstellen Sie sie.
  2. Fügen Sie der Datei das folgende Attribut hinzu:
    conf_application_logger.application=DEBUG
  3. Starten Sie die Edge-Benutzeroberfläche neu:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-ui neustart

Überwachungstools

Monitoring-Tools wie Nagios, Collectd, Graphite, Splunk, Sumologic und Monit können Ihnen dabei helfen, Ihre gesamte Unternehmensumgebung und Geschäftsprozesse überwachen.

Komponente

Nagios

Erhoben

Splunk

Prüfungen auf Systemebene

CPU-Auslastung

?

?

Kostenloser/verwendeter Arbeitsspeicher

?

?

Speicherplatznutzung

?

?

Netzwerkstatistik

?

?

Prozesse

?

API-Prüfungen

?

JMX

?

Java

?

Protokolldateien

?

Kritische Ereignisse

Ratenbegrenzung erreicht

?

Backend-Server (Hybris oder SharePoint) ist nicht erreichbar

?

FaaS (STS) ist nicht erreichbar

?

Ereignis vom Typ „Warnung“

SMTP-Server ist nicht erreichbar

?

SLA-Verstoß

?