Prácticas recomendadas de supervisión

Edge para nube privada v. 4.17.05

Alertas de supervisión

Apigee Edge te permite reenviar alertas a sistemas o herramientas de supervisión externos cuando se produce un error o falla debido a la falla de un evento. Estas alertas pueden ser alertas o eventos a nivel del sistema o de la aplicación. En general, las alertas a nivel de la aplicación son alertas personalizadas que se crean a partir de eventos generados. Por lo general, el administrador de red configura las condiciones personalizadas. Para obtener más información sobre las alertas, comunícate con el equipo de asistencia de Apigee.

Cómo configurar los límites de alerta

Establece un umbral después del cual se debe generar una alerta. Lo que establezcas depende de la configuración de tu hardware. El umbral se debe establecer en relación con tu capacidad. Por ejemplo, es posible que Apigee Edge sea demasiado bajo si solo tienes 6 GB de capacidad. Puedes asignar el umbral con el criterio igual a (=) o superior (>). También puedes especificar un intervalo de tiempo entre la generación de dos alertas consecutivas. Puedes usar la opción de horas, minutos y segundos.

Criterios para configurar alertas al nivel del sistema

En la siguiente tabla, se describen los criterios:

Alerta

Límite sugerido

Descripción

Poca memoria

500MB

La memoria es demasiado baja para iniciar un componente

Poco espacio en el disco (/var/log)

8 GB

El espacio en el disco es demasiado bajo.

Carga alta

3+

Los procesos en espera para ejecutarse aumentaron de forma inesperada.

Se detuvo el proceso

N/A, un valor booleano de verdadero o falso

Se detuvo el proceso de Java de Apigee en el sistema

Verificación de puertos específicos de Apigee y de terceros

Supervisa los siguientes puertos para asegurarte de que estén activos

  • Puertos 4526, 4527 y 4528 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 1099, 1100 y 1101 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 8081 y 15999 en routers
  • Puertos 8082 y 8998 en Message Processor

Puerto 8080 del servidor de administración. Verifica los siguientes puertos de terceros para asegurarte de que estén activos:

  • Puerto Qpid 5672
  • Puerto Postgres 5432
  • Puertos Cassandra 7000, 7199, 9042, 9160
  • Puerto 2181 de ZooKeeper
  • Puerto OpenLDAP 10389

Para determinar en qué puerto escucha las llamadas a la API cada componente de Apigee, emite las siguientes llamadas a la API al servidor de administración (que, por lo general, se encuentra en el puerto 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

El resultado de estos comandos contendrá secciones similares a la que se muestra a continuación. En la sección “http.management.port”, se proporciona el número de puerto del componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualiza registros

Los archivos de registro realizan un seguimiento de los mensajes relacionados con el evento o el funcionamiento del sistema. Los mensajes aparecen en el registro cuando los procesos comienzan y se completan o cuando se produce una condición de error. Cuando visualizas los archivos de registro, puedes obtener información sobre los componentes del sistema, por ejemplo, CPU, memoria, disco, carga, procesos, etc., antes y después de alcanzar un estado de error. Esto también te permite identificar y diagnosticar la fuente de los problemas actuales del sistema o ayudarte a predecir posibles problemas.

Por ejemplo, un registro del sistema típico de un componente contiene las siguientes entradas, como se muestra a continuación:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puedes editar el archivo /opt/apigee/conf/logback.xml para controlar el mecanismo de registro sin tener que reiniciar un servidor. El archivo logback.xml contiene la siguiente propiedad que establece la frecuencia con la que el mecanismo de registro comprueba si hay cambios en la configuración del archivo logback.xml:

<configuration scan="true" scanPeriod="30 seconds" >

De forma predeterminada, el mecanismo de registro verifica si hay cambios cada minuto. Si omites las unidades de tiempo en el atributo scanPeriod, el valor predeterminado es milisegundos.

En la siguiente tabla, se indica la ubicación de los archivos de registro de los componentes de la nube privada de Apigee Edge.

Componentes

Ubicación

Servidor de administración

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Procesador de mensajes

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor Postgres de Apigee

opt/apigee/var/log/edge-postgres-server

IU de Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Base de datos de PostgreSQL

opt/apigee/var/log/apigee-postgresql

Habilita los registros de depuración para el procesador de mensajes y la IU de Edge

Si deseas habilitar los registros de depuración para Message Processor, haz lo siguiente:

  1. En el nodo de Message Processor, edita /opt/apigee/customer/application/messsage-processor.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_system_log.level=DEBUG
  3. Reinicia el procesador de mensajes:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor reiniciar

Si deseas habilitar los registros de depuración para la IU de Edge, haz lo siguiente:

  1. En el nodo de IU de Edge, edita /opt/apigee/customer/application/ui.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_application_logger.application=DEBUG
  3. Reinicia la IU de Edge:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-ui restart

Herramientas de supervisión

Las herramientas de supervisión, como Nagios, Collectd, Graphite, Splunk, Sumologic y Monit pueden ayudarte a supervisar todo el entorno y los procesos empresariales.

Componente

Nagios

Recopilada

Splunk

Verificaciones a nivel del sistema

Uso de CPU

?

?

Memoria libre/usada

?

?

Uso del espacio en el disco

?

?

Estadísticas de la red

?

?

Procesos

?

Verificaciones de API

?

JMX

?

Java

?

Archivos de registro

?

Sucesos críticos

Alcanzaste el límite de frecuencia

?

No se puede acceder al servidor de backend (Hybris o SharePoint)

?

No se puede acceder a las FaaS (STS)

?

Eventos de advertencia

No se puede acceder al servidor SMTP

?

Incumplimiento del ANS

?