Práticas recomendadas de monitoramento

Alertas de monitoramento

O Apigee Edge permite encaminhar alertas para syslogs ou sistemas/ferramentas de monitoramento externos quando ocorre um erro ou uma falha devido à falha de um evento. Esses alertas podem ser de nível do sistema ou de nível do aplicativo/eventos. Os alertas no nível do aplicativo são principalmente alertas personalizados criados com base em eventos gerados. Normalmente, o administrador de rede configura as condições personalizadas. Para mais informações sobre alertas, entre em contato com o suporte da Apigee.

Definir limites de alerta

Defina um limite para que um alerta seja gerado. O que você define depende da sua configuração de hardware. O limite precisa ser definido em relação à sua capacidade. Por exemplo, o Apigee Edge pode ser muito baixo se você tiver apenas 6 GB de capacidade. Você pode atribuir um limite com o critério "igual a (=)" ou "maior que (>)". Também é possível especificar um intervalo de tempo entre duas gerações consecutivas de alertas. Você pode usar a opção horas/minutos/segundos.

Critérios para definir alertas no nível do sistema

A tabela a seguir descreve os critérios:

Alerta Limite sugerido Descrição

Pouca memória

500 MB

A memória é muito baixa para iniciar um componente

Pouco espaço em disco (/var/log)

8 GB

O espaço em disco está muito baixo.

Carga alta

3+

O número de processos aguardando execução aumentou inesperadamente

Processo interrompido

Não aplicável, um valor booleano verdadeiro ou falso

O processo Java da Apigee no sistema foi interrompido

Como verificar portas específicas da Apigee e de terceiros

Monitore as seguintes portas para garantir que elas estejam ativas:

  • Portas 4526, 4527 e 4528 no servidor de gerenciamento, roteador e processador de mensagens
  • Portas 1099, 1100 e 1101 no servidor de gerenciamento, roteador e processador de mensagens
  • Portas 8081 e 15999 em roteadores
  • Portas 8082 e 8998 nos processadores de mensagens
  • Porta 8080 no servidor de gerenciamento

Verifique se as seguintes portas de terceiros estão ativas:

  • Porta Qpid 5672
  • Porta 5432 do Postgres
  • Portas 7000, 7199, 9042 e 9160 do Cassandra
  • Porta 2181 do ZooKeeper
  • Porta 10389 do SymasLDAP

Para determinar em qual porta cada componente do Apigee está detectando chamadas de API, execute as seguintes chamadas de API para o servidor de gerenciamento (geralmente na porta 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

A saída desses comandos vai conter seções semelhantes à mostrada abaixo. A seção http.management.port informa o número da porta do componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Como visualizar os registros

Os arquivos de registro acompanham as mensagens relacionadas ao evento/operação do sistema. As mensagens aparecem no registro quando os processos começam e terminam ou quando ocorre uma condição de erro. Ao visualizar arquivos de registro, é possível obter informações sobre componentes do sistema, como CPU, memória, disco, carga, processos e assim por diante, antes e depois de atingir um estado de falha. Isso também permite identificar e diagnosticar a origem dos problemas atuais do sistema ou ajudar a prever possíveis problemas.

Por exemplo, um registro de sistema típico de um componente contém as seguintes entradas, conforme mostrado abaixo:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

É possível editar o arquivo /opt/apigee/conf/logback.xml para controlar o mecanismo de geração de registros sem precisar reiniciar um servidor. O arquivo logback.xml contém a seguinte propriedade, que define a frequência com que o mecanismo de geração de registros verifica o arquivo logback.xml em busca de mudanças na configuração:

<configuration scan="true" scanPeriod="30 seconds" >

Por padrão, o mecanismo de geração de registros verifica mudanças a cada minuto. Se você omitir as unidades de tempo no atributo scanPeriod, o padrão será milissegundos.

A tabela a seguir informa a localização dos arquivos de registro dos componentes da Apigee Edge para nuvem privada.

Componentes Local

Servidor de gerenciamento

opt/apigee/var/log/edge-management-server

Roteador

opt/apigee/var/log/edge-router

processador de mensagens

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor Postgres da Apigee

opt/apigee/var/log/edge-postgres-server

Interface do Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

SymasLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Banco de dados PostgreSQL

opt/apigee/var/log/apigee-postgresql

Como ativar registros de depuração para o processador de mensagens e a interface do Edge

Para ativar os registros de depuração do processador de mensagens:

  1. No nó do Message Processor, edite /opt/apigee/customer/application/message-processor.properties. Se ele não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_system_log.level=DEBUG
  3. Reinicie o processador de mensagens:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Para ativar os registros de depuração na interface do Edge:

  1. No nó da interface do Edge, edite /opt/apigee/customer/application/ui.properties. Se ele não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_application_logger.application=DEBUG
  3. Reinicie a interface do Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Práticas recomendadas do apigee-monit

Ao usar apigee-monit, a Apigee recomenda que você:

Ferramentas de monitoramento

Ferramentas de monitoramento como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit podem ajudar você a monitorar todo o ambiente empresarial e os processos de negócios.

Componente Nagios Collectd Splunk

Verificações no nível do sistema

Uso da CPU

Memória livre/usada

Uso de espaço em disco

Estatísticas da rede

Processos

Verificações de API

JMX

Java

Arquivos de registro

Eventos críticos

Limite de taxa atingido

Não é possível acessar o servidor de back-end (Hybris ou SharePoint)

Não é possível acessar o FaaS (STS)

Eventos de alerta

Não foi possível acessar o servidor SMTP

SLAs violados