Prácticas recomendadas de supervisión

Alertas de supervisión

Apigee Edge te permite reenviar alertas a syslogs o sistemas o herramientas de supervisión externos cuando se produce un error o una falla debido a la falla de un evento. Estas alertas pueden ser alertas o eventos a nivel del sistema o de la aplicación. Las alertas a nivel de la aplicación son, en su mayoría, alertas personalizadas que se crean en función de los eventos generados. Por lo general, el administrador de red configura las condiciones personalizadas. Para obtener más información sobre las alertas, comunícate con el equipo de asistencia de Apigee.

Cómo establecer umbrales de alertas

Establece un umbral después del cual se debe generar una alerta. Lo que configures dependerá de la configuración de tu hardware. El umbral debe establecerse en relación con tu capacidad. Por ejemplo, Apigee Edge podría ser demasiado bajo si solo tienes 6 GB de capacidad. Puedes asignar un umbral con el criterio igual a (=) o mayor que (>). También puedes especificar un intervalo de tiempo entre dos generaciones de alertas consecutivas. Puedes usar la opción de horas, minutos o segundos.

Criterios para configurar alertas a nivel del sistema

En la siguiente tabla, se describen los criterios:

Alerta Umbral sugerido Descripción

Poca memoria

500 MB

La memoria es demasiado baja para iniciar un componente.

Poco espacio en el disco (/var/log)

8 GB

Hay muy poco espacio en el disco.

Carga alta

3+

Los procesos que esperan a ejecutarse aumentaron de forma inesperada

Se detuvo el proceso

N/A, un valor booleano de verdadero o falso

Se detuvo el proceso de Java de Apigee en el sistema

Verifica los puertos específicos de Apigee y de terceros

Supervisa los siguientes puertos para asegurarte de que estén activos.

  • Puertos 4526, 4527 y 4528 en el servidor de administración, el router y Message Processor
  • Puertos 1099, 1100 y 1101 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 8081 y 15999 en routers
  • Puertos 8082 y 8998 en los procesadores de mensajes
  • Puerto 8080 en el servidor de administración

Verifica los siguientes puertos de terceros para asegurarte de que estén activos:

  • Puerto Qpid 5672
  • Puerto 5432 de Postgres
  • Puertos de Cassandra 7000, 7199, 9042 y 9160
  • Puerto 2181 de ZooKeeper
  • Puerto 10389 de OpenLDAP

Para determinar en qué puerto cada componente de Apigee escucha las llamadas a la API, realiza las siguientes llamadas a la API al servidor de administración (que generalmente se encuentra en el puerto 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

El resultado de estos comandos contendrá secciones similares a las que se muestran a continuación. La sección http.management.port proporciona el número de puerto del componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualice los registros

Los archivos de registro realizan un seguimiento de los mensajes relacionados con el evento o la operación del sistema. Los mensajes aparecen en el registro cuando comienzan y se completan los procesos, o cuando se produce una condición de error. Cuando ves los archivos de registro, puedes obtener información sobre los componentes del sistema, por ejemplo, la CPU, la memoria, el disco, la carga, los procesos, etcétera, antes y después de alcanzar un estado de error. Esto también te permite identificar y diagnosticar la fuente de los problemas actuales del sistema o ayudarte a predecir posibles problemas del sistema.

Por ejemplo, un registro del sistema típico de un componente contiene las siguientes entradas:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puedes editar el archivo /opt/apigee/conf/logback.xml para controlar el mecanismo de registro sin tener que reiniciar un servidor. El archivo logback.xml contiene la siguiente propiedad que establece la frecuencia con la que el mecanismo de registro verifica el archivo logback.xml en busca de cambios de configuración:

<configuration scan="true" scanPeriod="30 seconds" >

De forma predeterminada, el mecanismo de registro verifica si hay cambios cada minuto. Si omites las unidades de tiempo del atributo scanPeriod, su valor predeterminado es milisegundos.

En la siguiente tabla, se indica la ubicación de los archivos de registro de los componentes de la nube privada de Apigee Edge.

Componentes Ubicación

Servidor de administración

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Message Processor

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor de Postgres de Apigee

opt/apigee/var/log/edge-postgres-server

IU de Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Base de datos de PostgreSQL

opt/apigee/var/log/apigee-postgresql

Habilita los registros de depuración para el procesador de mensajes y la IU de Edge

Para habilitar los registros de depuración del procesador de mensajes, sigue estos pasos:

  1. En el nodo Message Processor, edita /opt/apigee/customer/application/messsage-processor.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_system_log.level=DEBUG
  3. Reinicia el procesador de mensajes:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Para habilitar los registros de depuración de la IU de Edge, haz lo siguiente:

  1. En el nodo de la IU de Edge, edita /opt/apigee/customer/application/ui.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_application_logger.application=DEBUG
  3. Reinicia la IU de Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Prácticas recomendadas de apigee-monit

Cuando uses apigee-monit, Apigee recomienda que hagas lo siguiente:

Herramientas de supervisión

Las herramientas de supervisión, como Nagios, Collectd, Graphite, Splunk, Sumologic y Monit, pueden ayudarte a supervisar todo tu entorno empresarial y tus procesos comerciales.

Componente Nagios Collectd Splunk

Verificaciones a nivel del sistema

Uso de CPU

Memoria libre o en uso

Uso del espacio en el disco

Estadísticas de la red

Procesos

Verificaciones de API

JMX

Java

Archivos de registro

Eventos críticos

Acierto del límite de frecuencia

No se puede establecer conexión con el servidor de backend (Hybris o SharePoint)

No se puede acceder a FaaS (STS)

Eventos de advertencia

No se puede establecer conexión con el servidor SMTP

Incumplimiento de los ANS