Práticas recomendadas de monitoramento

Edge para nuvem privada v4.18.01

Alertas de monitoramento

O Apigee Edge permite que você encaminhe alertas para syslogs ou sistemas/ferramentas de monitoramento externo quando um erro ou uma falha ocorre devido à falha de um evento. Esses alertas podem ser do sistema ou alertas/eventos no nível do aplicativo. Os alertas no nível do aplicativo são, na maioria das vezes, alertas personalizados criado com base nos eventos gerados. O administrador da rede geralmente configura pelas condições Para mais informações sobre alertas, entre em contato com o suporte da Apigee.

Como definir limites de alerta

Defina um limite após o qual um alerta precisa ser gerado. O que você define depende das suas configuração de hardware. O limite deve ser definido em relação à sua capacidade. Por exemplo, a Apigee A borda pode ser muito baixa se você só tiver 6 GB de capacidade. Você pode atribuir um limite com igual a (=) ou maior que (>). Também é possível especificar um intervalo de tempo entre duas métricas a geração de alertas. Você pode usar a opção de horas/minutos/segundos.

Critérios para configurar alertas no nível do sistema

A tabela a seguir descreve os critérios:

Alerta

Limite sugerido

Descrição

Pouca memória

500 MB

Pouca memória para iniciar um componente

Pouco espaço em disco (/var/log)

8 GB

O espaço em disco está muito baixo.

Carga alta

3+

Os processos aguardando execução aumentaram inesperadamente

Processo interrompido

N/A, um valor booleano de true ou false

O processo da Apigee Java no sistema foi interrompido

Verificação específica da Apigee e de terceiros Portas

Monitore as seguintes portas para verificar se elas estão ativas

  • Portas 4526, 4527 e 4528 no servidor de gerenciamento, no roteador e no processador de mensagens
  • Portas 1099, 1100 e 1101 no servidor de gerenciamento, no roteador e no processador de mensagens
  • Portas 8081 e 15999 nos roteadores
  • Portas 8082 e 8998 em processadores de mensagens
  • Porta 8080 no servidor de gerenciamento

Verifique se as portas de terceiros a seguir estão ativas:

  • Porta 5672 do Qpid
  • Porta 5432 do Postgres
  • Porta 7000, 7199, 9042, 9160 do Cassandra
  • Porta 2181 do ZooKeeper
  • Porta 10389 do OpenLDAP

Para determinar em qual porta cada componente da Apigee está ouvindo chamadas de API, emita as seguintes chamadas de API para o servidor de gerenciamento (que geralmente está na porta 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

A saída desses comandos vai conter seções semelhantes à mostrada abaixo. A &quot;http.management.port&quot; seção fornece o número da porta do componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Como visualizar os registros

Os arquivos de registro rastreiam as mensagens sobre o evento/a operação do sistema. As mensagens aparecem no registro quando os processos começam e são concluídos ou quando ocorre uma condição de erro. Exibindo registro informações sobre componentes do sistema, como CPU, memória, disco, carga, antes e depois de um estado com falha. Isso também permite identificar e diagnosticar a fonte dos problemas atuais do sistema ou ajudar a prever possíveis problemas para solucionar problemas fáceis e de produção.

Por exemplo, um registro comum do sistema de um componente contém as seguintes entradas, como mostrado abaixo:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

É possível editar o arquivo /opt/apigee/conf/logback.xml para controlar o mecanismo de geração de registros sem ter que reiniciar o servidor. O arquivo logback.xml contém a seguinte propriedade que define o frequência com que o mecanismo de geração de registros verifica o arquivo logback.xml em busca de alterações de configuração:

<configuration scan="true" scanPeriod="30 seconds" >

Por padrão, o mecanismo de geração de registros verifica se há alterações a cada minuto. Se você omitir as unidades de tempo ao atributo scanPeriod, ele o padrão é de milissegundos.

A tabela a seguir informa o local dos arquivos de registro dos componentes da nuvem privada do Apigee Edge.

Componentes

Local

Servidor de gerenciamento

opt/apigee/var/log/edge-management-server

Roteador

opt/apigee/var/log/edge-router

processador de mensagens

opt/apigee/var/log/edge-message-processor

Servidor Qpid

opt/apigee/var/log/edge-qpid-server

Servidor do Apigee Postgres

opt/apigee/var/log/edge-postgres-server

interface do Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Banco de dados PostgreSQL

opt/apigee/var/log/apigee-postgresql

Como ativar registros de depuração para a mensagem Interface do processador e de borda

Para ativar os registros de depuração para o processador de mensagens:

  1. No nó "Processador de mensagens", edite /opt/apigee/customer/application/messsage-processor.properties. Se esse arquivo não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_system_log.level=DEBUG
  3. Reinicie o processador de mensagens:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor restart

Para ativar os registros de depuração para a interface do Edge:

  1. No nó da IU do Edge, edite /opt/apigee/customer/application/ui.properties. Se esse arquivo não existir, crie-o.
  2. Adicione a seguinte propriedade ao arquivo:
    conf_application_logger.application=DEBUG
  3. Reinicie a interface do Edge:
    &gt; /opt/apigee/apigee-service/bin/apigee-service Edge-ui reinicialização

Ferramentas de monitoramento

Ferramentas de monitoramento como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit podem ajudar você. monitorar todo o ambiente corporativo e os processos de negócios.

Componente

Nagios

Coletada

Splunk

Verificações no nível do sistema

Uso da CPU

Memória livre/usada

Uso do espaço em disco

Estatísticas da rede

Processos

Verificações de API

JMX

Java

Arquivos de registros

Eventos críticos

Limite de taxa atingido

Não é possível acessar o servidor de back-end (Hybris ou SharePoint)

Não foi possível acessar o FaaS (STS)

Eventos de alerta

Não foi possível acessar o servidor SMTP

SLAs violados