Práticas recomendadas de monitoramento

Alertas de monitoramento

O Apigee Edge permite encaminhar alertas para syslogs ou sistemas/ferramentas de monitoramento externo quando ocorre um erro ou uma falha devido à falha de um evento. Esses alertas podem ser do sistema ou do aplicativo. Os alertas no nível do aplicativo são, em sua maioria, alertas personalizados criados com base nos eventos gerados. O administrador de rede geralmente configura as condições personalizadas. Para mais informações sobre alertas, entre em contato com o suporte da Apigee.

Definir limites de alerta

Defina um limite após o qual um alerta precisa ser gerado. O que você define depende da configuração do hardware. O limite precisa ser definido em relação à sua capacidade. Por exemplo, o Apigee Edge pode ser muito baixo se você tiver apenas 6 GB de capacidade. É possível atribuir o limite com o critério igual a (=) ou maior que (>). Também é possível especificar um intervalo de tempo entre duas gerações de alertas consecutivas. Você pode usar a opção de horas/minutos/segundos.

Critérios para definir alertas no nível do sistema

A tabela a seguir descreve os critérios:

Alerta Limite sugerido Descrição

Pouca memória

500 MB

A memória está muito baixa para iniciar um componente

Pouco espaço em disco (/var/log)

8 GB

O espaço em disco está muito baixo.

Carga alta

3+

Os processos que aguardam a execução aumentaram inesperadamente

Processo interrompido

N/A, um valor booleano de verdadeiro ou falso

O processo do Java da Apigee no sistema foi interrompido

Como verificar portas específicas da Apigee e de terceiros

Monitore as portas a seguir para garantir que elas estejam ativas

  • Portas 4526, 4527 e 4528 no servidor de gerenciamento, no roteador e no processador de mensagens
  • Portas 1099, 1100 e 1101 no servidor de gerenciamento, no roteador e no processador de mensagens
  • Portas 8081 e 15999 em roteadores
  • Portas 8082 e 8998 em processadores de mensagens
  • Porta 8080 no servidor de gerenciamento

Verifique se as portas de terceiros a seguir estão ativas:

  • Porta Qpid 5672
  • Porta 5432 do Postgres
  • Porta do Cassandra 7000, 7199, 9042, 9160
  • Porta 2181 do ZooKeeper
  • Porta 10389 do OpenLDAP

Para determinar em qual porta cada componente do Apigee está detectando chamadas de API, emita as seguintes chamadas de API para o servidor de gerenciamento (geralmente na porta 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

A saída desses comandos vai conter seções semelhantes à mostrada abaixo. A seção http.management.port fornece o número da porta para o componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Como visualizar os registros

Os arquivos de registro rastreiam as mensagens relacionadas ao evento/operação do sistema. As mensagens aparecem no registro quando os processos começam e são concluídos ou quando ocorre uma condição de erro. Ao consultar os arquivos de registro, você pode ter informações sobre componentes do sistema, por exemplo, CPU, memória, disco, carga, processos e assim por diante, antes e depois de atingir um estado de falha. Isso também permite identificar e diagnosticar a origem dos problemas atuais do sistema ou ajudar a prever possíveis problemas do sistema.

Por exemplo, um registro de sistema típico de um componente contém as seguintes entradas, conforme mostrado abaixo:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

É possível editar o arquivo /opt/apigee/conf/logback.xml para controlar o mecanismo de registro sem precisar reiniciar um servidor. O arquivo logback.xml contém a seguinte propriedade que define a frequência com que o mecanismo de registro verifica o arquivo logback.xml em busca de mudanças de configuração:

<configuration scan="true" scanPeriod="30 seconds" >

Por padrão, o mecanismo de registro verifica mudanças a cada minuto. Se você omitir as unidades de tempo do atributo scanPeriod, o padrão será milissegundos.

A tabela a seguir informa o local dos arquivos de registro dos componentes da Apigee Edge para nuvem privada.

Componentes Local

Servidor de gerenciamento

opt/apigee/var/log/edge-management-server

Roteador

opt/apigee/var/log/edge-router

processador de mensagens

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Interface do Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Banco de dados PostgreSQL

opt/apigee/var/log/apigee-postgresql

Como ativar os registros de depuração para a interface do processador de mensagens e do Edge

Para ativar os registros de depuração do processador de mensagens:

  1. No nó do processador de mensagens, edite /opt/apigee/customer/application/messsage-processor.properties. Se esse arquivo não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_system_log.level=DEBUG
  3. Reinicie o processador de mensagens:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Para ativar os registros de depuração na interface do Edge:

  1. No nó da interface Edge, edite /opt/apigee/customer/application/ui.properties. Se esse arquivo não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_application_logger.application=DEBUG
  3. Reinicie a interface do Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Práticas recomendadas de apigee-monit

Ao usar apigee-monit, a Apigee recomenda:

Ferramentas de monitoramento

Ferramentas de monitoramento, como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit, podem ajudar você a monitorar todo o ambiente empresarial e os processos de negócios.

Componente Nagios Collectd Splunk

Verificações no nível do sistema

Uso da CPU

Memória livre/usada

Uso de espaço em disco

Estatísticas da rede

Processos

Verificações de API

JMX

Java

Arquivos de registro

Eventos críticos

Limite de taxa atingido

Não é possível acessar o servidor de back-end (Hybris ou SharePoint)

Não é possível acessar o FaaS (STS)

Eventos de alerta

Não foi possível acessar o servidor SMTP

SLAs violados