Prácticas recomendadas de supervisión

Edge for Private Cloud v. 4.17.09

Alertas de supervisión

Apigee Edge permite reenviar alertas a syslogs o sistemas/herramientas de supervisión externos cuando se produce un error o una falla se produce debido a la falla de un evento. Estas alertas pueden ser a nivel del sistema alertas o eventos a nivel de la aplicación. Las alertas a nivel de la aplicación son, en su mayoría, alertas personalizadas que se crean en función de los eventos que se generan. Por lo general, el administrador de red configura condiciones. Para obtener más información sobre las alertas, comunícate con el equipo de asistencia de Apigee.

Configura umbrales de alerta

Establece un umbral después del cual se debe generar una alerta. Lo que establezcas dependerá de tu configuración de hardware. El umbral se debe establecer en relación con tu capacidad. Por ejemplo, Apigee Es posible que el perímetro sea demasiado bajo si solo tienes 6 GB de capacidad. Puedes asignar umbral con un valor igual a (=) o mayor que (>). También puedes especificar un intervalo de tiempo entre dos filas la generación de alertas. Puedes usar la opción de horas, minutos o segundos.

Criterios para configurar alertas a nivel del sistema

En la siguiente tabla, se describen los criterios:

Alerta

Límite sugerido

Descripción

Memoria baja

500MB

La memoria es demasiado baja para iniciar un componente

Poco espacio en el disco (/var/log)

8 GB

Hay poco espacio en el disco.

Carga alta

3+

Los procesos en espera para ejecutarse aumentaron de forma inesperada

Se detuvo el proceso

N/A, un valor booleano de verdadero o falso

Se detuvo el proceso de Java de Apigee en el sistema

Verificación de contenido específico y externo de Apigee Puertos

Supervisa los siguientes puertos para asegurarte de que estén activos

  • Puertos 4526, 4527 y 4528 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 1099, 1100 y 1101 en el servidor de administración, el router y el procesador de mensajes
  • Puertos 8081 y 15999 en los routers
  • Puertos 8082 y 8998 en Message Processor
  • Puerto 8080 en el servidor de administración

Verifica los siguientes puertos de terceros para asegurarte de que estén activos:

  • Puerto Qpid 5672
  • Puerto Postgres 5432
  • Puertos Cassandra 7000, 7199, 9042 y 9160
  • Puerto 2181 de ZooKeeper
  • Puerto OpenLDAP 10389

Para determinar en qué puerto escucha cada componente de Apigee las llamadas a la API, emite las siguientes llamadas a la API al servidor de administración (que, por lo general, se encuentra en el puerto 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

El resultado de estos comandos contendrá secciones similares a la que se muestra a continuación. El &quot;http.management.port&quot; sección indica el número de puerto del componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualice los registros

Los archivos de registro realizan un seguimiento de los mensajes relacionados con el evento y la operación del sistema. Los mensajes aparecerán en el registro cuando los procesos comienzan y se completan, o cuando se produce una condición de error. Mediante la visualización del registro información sobre los componentes del sistema, como CPU, memoria, disco, carga antes y después de alcanzar un estado de error. Esto también te permite identificar y diagnosticar la fuente de los problemas actuales del sistema o ayudarte a predecir su posible sistema problemas.

Por ejemplo, un registro típico del sistema de un componente contiene las siguientes entradas, como se muestra a continuación:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puedes editar el archivo /opt/apigee/conf/logback.xml para controlar el mecanismo de registro sin tener que reiniciar un servidor. El archivo logback.xml contiene la siguiente propiedad que configura las frecuencia con la que el mecanismo de registro comprueba el archivo logback.xml en busca de cambios de configuración:

<configuration scan="true" scanPeriod="30 seconds" >

De forma predeterminada, el mecanismo de registro comprueba si hay cambios cada minuto. Si omites las unidades de tiempo al atributo scanPeriod su configuración predeterminada es milisegundos.

En la siguiente tabla, se indica la ubicación de los archivos de registro de los componentes de la nube privada de Apigee Edge.

Componentes

Ubicación

Servidor de administración

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

Message Processor

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor de Apigee Postgres

opt/apigee/var/log/edge-postgres-server

IU de Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Base de datos de PostgreSQL

opt/apigee/var/log/apigee-postgresql

Habilita los registros de depuración para el mensaje IU de procesador y Edge

Para habilitar los registros de depuración de Message Processor, haz lo siguiente:

  1. En el nodo del procesador de mensajes, edita /opt/apigee/customer/application/messsage-processor.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_system_log.level=DEBUG
  3. Reinicia el Message Processor:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor restart

Para habilitar los registros de depuración de la IU de Edge, haz lo siguiente:

  1. En el nodo de la IU de Edge, edita /opt/apigee/customer/application/ui.properties. Si ese archivo no existe, créalo.
  2. Agrega la siguiente propiedad al archivo:
    conf_application_logger.application=DEBUG
  3. Reinicia la IU de Edge:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-ui restart

Herramientas de supervisión

Las herramientas de supervisión como Nagios, Collectd, Graphite, Splunk, Sumologic y Monit pueden ayudarte y supervisar todo el entorno y los procesos empresariales.

Componente

Nagios

Recopilado

Splunk

Verificaciones a nivel del sistema

Uso de CPU

?

?

Memoria libre/utilizada

?

?

Uso del espacio en el disco

?

?

Estadísticas de la red

?

?

Procesos

?

Verificaciones de API

?

JMX

?

Java

?

Archivos de registro

?

Eventos críticos

Alcanzaste el límite de frecuencia

?

No se puede acceder al servidor de backend (Hybris o SharePoint)

?

No se puede acceder a FaaS (STS)

?

Eventos de advertencia

No se puede acceder al servidor SMTP

?

ANS que se incumplieron

?