Prácticas recomendadas de supervisión

Alertas de supervisión

Apigee Edge te permite reenviar alertas a registros del sistema o a sistemas o herramientas de supervisión externos cuando se produce un error o una falla debido a la falla de un evento. Estas alertas pueden ser a nivel del sistema o de la aplicación. Las alertas a nivel de la aplicación son, en su mayoría, alertas personalizadas que se crean en función de los eventos generados. Por lo general, el administrador de red configura las condiciones personalizadas. Para obtener más información sobre las alertas, comunícate con el equipo de asistencia de Apigee.

Cómo establecer umbrales de alertas

Establece un umbral después del cual se debe generar una alerta. El valor que establezcas dependerá de la configuración de hardware. El umbral se debe establecer en relación con tu capacidad. Por ejemplo, Apigee Edge podría ser demasiado bajo si solo tienes 6 GB de capacidad. Puedes asignar el umbral con el criterio igual a (=) o mayor que (>). También puedes especificar un intervalo de tiempo entre dos generaciones de alertas consecutivas. Puedes usar la opción de horas, minutos y segundos.

Criterios para configurar alertas a nivel del sistema

En la siguiente tabla, se describen los criterios:

Alerta Umbral sugerido Descripción

Poca memoria

500 MB

La memoria es demasiado baja para iniciar un componente

Poco espacio en el disco (/var/log)

8 GB

El espacio en el disco es demasiado bajo.

Carga alta

3+

Los procesos que esperan ejecutarse aumentaron de forma inesperada

Se detuvo el proceso

N/A, un valor booleano de verdadero o falso

Se detuvo el proceso de Apigee Java en el sistema

Verifica los puertos específicos de Apigee y de terceros

Supervisa los siguientes puertos para asegurarte de que estén activos

  • Puertos 4526, 4527 y 4528 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 1099, 1100 y 1101 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 8081 y 15999 en routers
  • Puertos 8082 y 8998 en Message Processors
  • Puerto 8080 en el servidor de administración

Verifica los siguientes puertos de terceros para asegurarte de que estén activos:

  • Puerto 5672 de Qpid
  • Puerto 5432 de Postgres
  • Puertos de Cassandra 7000, 7199, 9042 y 9160
  • Puerto 2181 de ZooKeeper
  • Puerto 10389 de SymasLDAP

Para determinar en qué puerto escucha cada componente de Apigee las llamadas a la API, emite las siguientes llamadas a la API al servidor de administración (que generalmente se encuentra en el puerto 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

El resultado de estos comandos contendrá secciones similares a las que se muestran a continuación. La sección http.management.port proporciona el número de puerto del componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualiza registros

Los archivos de registro realizan un seguimiento de los mensajes relacionados con el evento o la operación del sistema. Los mensajes aparecen en el registro cuando los procesos comienzan y finalizan, o cuando se produce una condición de error. Si ves los archivos de registro, puedes obtener información sobre los componentes del sistema, por ejemplo, la CPU, la memoria, el disco, la carga, los procesos, etcétera, antes y después de alcanzar un estado de falla. Esto también te permite identificar y diagnosticar la fuente de los problemas actuales del sistema, o bien predecir posibles problemas del sistema.

Por ejemplo, un registro del sistema típico de un componente contiene las siguientes entradas, como se muestra a continuación:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puedes editar el archivo /opt/apigee/conf/logback.xml para controlar el mecanismo de registro sin tener que reiniciar un servidor. El archivo logback.xml contiene la siguiente propiedad que establece la frecuencia con la que el mecanismo de registro verifica el archivo logback.xml para detectar cambios en la configuración:

<configuration scan="true" scanPeriod="30 seconds" >

De forma predeterminada, el mecanismo de registro verifica los cambios cada minuto. Si omites las unidades de tiempo del atributo scanPeriod, se usarán milisegundos de forma predeterminada.

En la siguiente tabla, se indica la ubicación de los archivos de registro de los componentes de Apigee Edge Private Cloud.

Componentes Ubicación

Servidor de administración

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Message Processor

opt/apigee/var/log/edge-message-processor

Servidor de Qpid

opt/apigee/var/log/edge-qpid-server

Servidor de Apigee Postgres

opt/apigee/var/log/edge-postgres-server

IU de Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

SymasLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Base de datos de PostgreSQL

opt/apigee/var/log/apigee-postgresql

Habilita los registros de depuración para el procesador de mensajes y la IU de Edge

Para habilitar los registros de depuración del procesador de mensajes, haz lo siguiente:

  1. En el nodo Message Processor, edita /opt/apigee/customer/application/message-processor.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_system_log.level=DEBUG
  3. Reinicia el Message Processor:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Para habilitar los registros de depuración de la IU de Edge, haz lo siguiente:

  1. En el nodo de la IU de Edge, edita /opt/apigee/customer/application/ui.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_application_logger.application=DEBUG
  3. Reinicia la IU de Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Prácticas recomendadas de apigee-monit

Cuando uses apigee-monit, Apigee recomienda que hagas lo siguiente:

Herramientas de supervisión

Las herramientas de supervisión, como Nagios, Collectd, Graphite, Splunk, Sumologic y Monit, pueden ayudarte a supervisar todo tu entorno empresarial y tus procesos comerciales.

Componente Nagios Collectd Splunk

Verificaciones a nivel del sistema

Uso de CPU

Memoria libre o en uso

Uso del espacio en el disco

Estadísticas de la red

Procesos

Verificaciones de API

JMX

Java

Archivos de registro

Eventos críticos

Se alcanzó el límite de frecuencia

No se puede acceder al servidor de backend (Hybris o SharePoint)

No se puede acceder a FaaS (STS)

Eventos de advertencia

No se puede acceder al servidor SMTP

Se incumplieron los ANS