Práticas recomendadas de monitoramento

Edge para nuvem privada v4.18.01

Alertas de monitoramento

O Apigee Edge permite encaminhar alertas para syslogs ou sistemas/ferramentas de monitoramento externos quando ocorre um erro ou uma falha devido à falha de um evento. Esses alertas podem ser alertas/eventos do sistema ou do aplicativo. Os alertas no nível do aplicativo são principalmente alertas personalizados criados com base em eventos gerados. O administrador da rede geralmente configura as condições personalizadas. Para mais informações sobre alertas, entre em contato com o suporte da Apigee.

Como definir limites de alerta

Defina um limite para gerar um alerta. As definições vão depender da configuração do hardware. É preciso definir o limite de acordo com a capacidade. Por exemplo, o Apigee Edge pode ser muito baixo se você tiver apenas 6 GB de capacidade. É possível atribuir um limite com um critério igual a (=) ou maior que (>). Também é possível especificar um intervalo de tempo entre duas gerações consecutivas de alertas. Use a opção horas/minutos/segundos.

Critérios para configurar alertas no nível do sistema

A tabela a seguir descreve os critérios:

Alerta

Limite sugerido

Descrição

Pouca memória

500 MB

A memória está muito baixa para iniciar um componente

Pouco espaço em disco (/var/log)

8 GB

O espaço em disco diminuiu muito.

Carga alta

3+

Os processos em espera para execução aumentaram inesperadamente

Processo interrompido

N/A, um valor booleano de verdadeiro ou falso

O processo da Apigee Java no sistema foi interrompido

Como verificar portas específicas da Apigee e de terceiros

Monitore as seguintes portas para garantir que elas estejam ativas

  • Porta 4526, 4527 e 4528 no servidor de gerenciamento, no roteador e no processador de mensagens
  • Porta 1099, 1100 e 1101 no servidor de gerenciamento, roteador e processador de mensagens
  • Portas 8081 e 15999 em roteadores
  • Porta 8082 e 8998 nos processadores de mensagens
  • Porta 8080 no servidor de gerenciamento

Verifique se as seguintes portas de terceiros estão ativas:

  • Porta Qpid 5672
  • Porta Postgres 5432
  • Porta Cassandra 7000, 7199, 9042, 9160
  • Porta 2181 do ZooKeeper
  • Porta 10389 do OpenLDAP

Para determinar em qual porta cada componente da Apigee está detectando chamadas de API, emita as seguintes chamadas de API para o servidor de gerenciamento (que geralmente está na porta 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

A saída desses comandos vai conter seções semelhantes às mostradas abaixo. A seção "http.management.port" informa o número da porta do componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Como visualizar os registros

Os arquivos de registros rastreiam mensagens sobre o evento/operação do sistema. As mensagens aparecem no registro quando os processos começam e são concluídos ou quando ocorre uma condição de erro. Ao visualizar arquivos de registros, é possível ver informações sobre componentes do sistema, por exemplo, CPU, memória, disco, carga, processos etc., antes e depois de atingir um estado com falha. Assim, é possível identificar e diagnosticar a origem dos problemas atuais do sistema ou prever possíveis problemas.

Por exemplo, um registro típico do sistema de um componente contém as seguintes entradas, conforme mostrado abaixo:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

É possível editar o arquivo /opt/apigee/conf/logback.xml para controlar o mecanismo de geração de registros sem precisar reiniciar um servidor. O arquivo logback.xml contém a propriedade a seguir, que define a frequência com que o mecanismo de geração de registros verifica o arquivo logback.xml em busca de alterações de configuração:

<configuration scan="true" scanPeriod="30 seconds" >

Por padrão, o mecanismo de geração de registros verifica as alterações a cada minuto. Se você omitir as unidades de tempo para o atributo scanPeriod, ele será definido como milissegundos por padrão.

A tabela a seguir informa o local dos arquivos de registros dos componentes da nuvem privada do Apigee Edge.

Componentes

Local

Servidor de gerenciamento

opt/apigee/var/log/edge-management-server

Roteador

opt/apigee/var/log/edge-router

processador de mensagens

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor Apigee Postgres

opt/apigee/var/log/edge-postgres-server

interface do Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Quádiz

opt/apigee/var/log/apigee-qpidd

Banco de dados PostgreSQL

opt/apigee/var/log/apigee-postgresql

Como ativar registros de depuração para o processador de mensagens e a IU do Edge

Para ativar os registros de depuração para o processador de mensagens:

  1. No nó "Processador de mensagens", edite /opt/apigee/customer/application/messsage-processor.properties. Se esse arquivo não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_system_log.level=DEBUG
  3. Reinicie o processador de mensagens:
    > /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Para ativar os registros de depuração para a interface do Edge:

  1. No nó da IU do Edge, edite /opt/apigee/customer/application/ui.properties. Se esse arquivo não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_application_logger.application=DEBUG
  3. Reinicie a IU do Edge:
    > /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Ferramentas de monitoramento

Ferramentas de monitoramento, como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit, podem ajudar você a monitorar todo o ambiente corporativo e os processos de negócios.

Componente

Nagios (em inglês)

Coletada

Splunk

Verificações no nível do sistema

Utilização de CPU

Memória livre/usada

Uso do espaço em disco

Estatísticas da rede

Processos

Verificações de API

JMX

Java

Arquivos de registros

Eventos críticos

Limite de taxa atingido

Não foi possível acessar o servidor de back-end (Hybris ou Share)

Não é possível acessar a FaaS (STS)

Eventos de alerta

Não foi possível acessar o servidor SMTP

SLAs violados