Bonnes pratiques de surveillance

Edge for Private Cloud v. 4.17.09

Alertes Monitoring

Apigee Edge vous permet de transférer des alertes à des systèmes syslog ou de surveillance/outils de surveillance externes en cas d'erreur ou d'échec dû à un échec d'événement. Il peut s'agir d'alertes/événements au niveau du système ou de l'application. Les alertes au niveau de l'application sont principalement des alertes personnalisées créées en fonction des événements générés. L'administrateur réseau configure généralement les conditions personnalisées. Pour en savoir plus sur les alertes, contactez l'assistance Apigee.

Définir des seuils d'alerte

Définissez un seuil après lequel une alerte doit être générée. La définition dépend de la configuration matérielle. Le seuil doit être défini en fonction de votre capacité. Par exemple, Apigee Edge peut être trop faible si vous n'avez que 6 Go de capacité. Vous pouvez attribuer un seuil égal à (=) ou supérieur à (>). Vous pouvez également spécifier un intervalle de temps entre deux générations d'alertes consécutives. Vous pouvez utiliser l'option "heures/minutes/secondes".

Critères de définition des alertes au niveau du système

Le tableau suivant décrit les critères:

Alerte

Seuil suggéré

Description

Mémoire faible

500 Mo

Mémoire insuffisante pour démarrer un composant

Espace disque faible (/var/log)

8 Go

L'espace disque est insuffisant.

Charge élevée

3+

Les processus en attente d'exécution ont augmenté de manière inattendue

Processus arrêté

N/A, valeur booléenne vraie ou fausse

Le processus Java Apigee s'est arrêté dans le système

Vérifier les ports spécifiques à Apigee et les ports tiers

Surveillez les ports suivants pour vous assurer qu'ils sont actifs

  • Ports 4526, 4527 et 4528 sur le serveur de gestion, le routeur et le processeur de messages
  • Ports 1099, 1100 et 1101 sur le serveur de gestion, le routeur et le processeur de messages
  • Ports 8081 et 15999 sur les routeurs
  • Ports 8082 et 8998 sur les processeurs de messages
  • Port 8080 sur le serveur de gestion

Vérifiez que les ports tiers suivants sont actifs:

  • Port Qpid 5672
  • Port Postgres 5432
  • Ports Cassandra 7000, 7199, 9042, 9160
  • Port ZooKeeper 2181
  • Port OpenLDAP 10389

Pour déterminer le port sur lequel chaque composant Apigee écoute les appels d'API, envoyez les appels d'API suivants au serveur de gestion (qui se trouve généralement sur le port 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Le résultat de ces commandes contient des sections semblables à celles présentées ci-dessous. La section "http.management.port" indique le numéro de port du composant spécifié.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Afficher les journaux

Les fichiers journaux suivent les messages concernant l'événement ou le fonctionnement du système. Les messages apparaissent dans le journal lorsque les processus commencent et se terminent, ou lorsqu'une condition d'erreur se produit. En affichant les fichiers journaux, vous pouvez obtenir des informations sur les composants système (par exemple, le processeur, la mémoire, le disque, la charge, les processus, etc.), avant et après avoir atteint un état défaillant. Cela vous permet également d'identifier et de diagnostiquer la source des problèmes système actuels, ou de prédire les problèmes potentiels liés au système.

Par exemple, le journal système d'un composant type contient les entrées suivantes:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Vous pouvez modifier le fichier /opt/apigee/conf/logback.xml pour contrôler le mécanisme de journalisation sans avoir à redémarrer un serveur. Le fichier logback.xml contient la propriété suivante qui définit la fréquence à laquelle le mécanisme de journalisation recherche les modifications de configuration dans le fichier logback.xml:

<configuration scan="true" scanPeriod="30 seconds" >

Par défaut, le mécanisme de journalisation vérifie les modifications toutes les minutes. Si vous omettez les unités de temps à l'attribut scanPeriod, la valeur par défaut est exprimée en millisecondes.

Le tableau suivant indique l'emplacement des fichiers journaux des composants du cloud privé Apigee Edge.

Composants

Ville/Pays

Serveur de gestion

opt/apigee/var/log/edge-management-server

Routeur

opt/apigee/var/log/edge-router

Processeur de messages

opt/apigee/var/log/edge-message-processor

Qpid Server

opt/apigee/var/log/edge-qpid-server

Serveur Apigee Postgres

opt/apigee/var/log/edge-postgres-server

UI périphérique

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper,

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Base de données PostgreSQL

opt/apigee/var/log/apigee-postgresql

Activer les journaux de débogage pour le processeur de messages et l'interface utilisateur Edge

Pour activer les journaux de débogage pour le processeur de messages:

  1. Sur le nœud Processeur de message, modifiez /opt/apigee/customer/application/messsage-processor.properties. Si ce fichier n'existe pas, créez-le.
  2. Ajoutez la propriété suivante au fichier:
    conf_system_log.level=DEBUG
  3. Redémarrez le processeur de messages:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor restart

Pour activer les journaux de débogage pour l'interface utilisateur Edge:

  1. Sur le nœud de l'interface utilisateur Edge, modifiez /opt/apigee/customer/application/ui.properties. Si ce fichier n'existe pas, créez-le.
  2. Ajoutez la propriété suivante au fichier:
    conf_application_logging.application=DEBUG
  3. Redémarrez l'interface utilisateur Edge:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-ui restart

Outils de surveillance

Des outils de surveillance tels que Nagios, Collectd, Graphite, Splunk, Sumologic et Monit peuvent vous aider à surveiller l'ensemble de votre environnement d'entreprise et de vos processus métier.

Composant

Nagio

Collecte

Splunk

Vérifications au niveau du système

Utilisation du processeur

?

?

Mémoire disponible/utilisée

?

?

Espace disque utilisé

?

?

Statistiques du réseau

?

?

Processus

?

Vérifications de l'API

?

JMX

?

Java

?

Fichiers journaux

?

Événements critiques

Limite de débit atteinte

?

Impossible d'accéder au serveur backend (Hybris ou SharePoint)

?

Impossible d'atteindre le paramètre FaaS (STS)

?

Warning events

Impossible d'accéder au serveur SMTP

?

Non-respect du contrat de niveau de service

?