Práticas recomendadas de monitoramento

Alertas de monitoramento

O Apigee Edge permite encaminhar alertas para syslogs ou sistemas/ferramentas de monitoramento externo quando ocorre um erro ou uma falha devido à falha de um evento. Esses alertas podem ser do sistema ou do aplicativo. Os alertas no nível do aplicativo são, em sua maioria, alertas personalizados criados com base nos eventos gerados. O administrador de rede geralmente configura as condições personalizadas. Para mais informações sobre alertas, entre em contato com o suporte da Apigee.

Definir limites de alerta

Defina um limite após o qual um alerta precisa ser gerado. O que você define depende da configuração do hardware. O limite precisa ser definido em relação à sua capacidade. Por exemplo, o Apigee Edge pode ser muito baixo se você tiver apenas 6 GB de capacidade. É possível atribuir o limite com o critério igual a (=) ou maior que (>). Também é possível especificar um intervalo de tempo entre duas gerações de alertas consecutivas. Você pode usar a opção de horas/minutos/segundos.

Critérios para definir alertas no nível do sistema

A tabela a seguir descreve os critérios:

Alerta	Limite sugerido	Descrição
Pouca memória	500 MB	A memória está muito baixa para iniciar um componente
Pouco espaço em disco (/var/log)	8 GB	O espaço em disco está muito baixo.
Carga alta	3+	Os processos que aguardam a execução aumentaram inesperadamente
Processo interrompido	N/A, um valor booleano de verdadeiro ou falso	O processo do Java da Apigee no sistema foi interrompido

Como verificar portas específicas da Apigee e de terceiros

Monitore as portas a seguir para garantir que elas estejam ativas

Portas 4526, 4527 e 4528 no servidor de gerenciamento, no roteador e no processador de mensagens
Portas 1099, 1100 e 1101 no servidor de gerenciamento, no roteador e no processador de mensagens
Portas 8081 e 15999 em roteadores
Portas 8082 e 8998 em processadores de mensagens
Porta 8080 no servidor de gerenciamento

Verifique se as portas de terceiros a seguir estão ativas:

Porta Qpid 5672
Porta 5432 do Postgres
Porta do Cassandra 7000, 7199, 9042, 9160
Porta 2181 do ZooKeeper
Porta 10389 do OpenLDAP

Para determinar em qual porta cada componente do Apigee está detectando chamadas de API, emita as seguintes chamadas de API para o servidor de gerenciamento (geralmente na porta 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

A saída desses comandos vai conter seções semelhantes à mostrada abaixo. A seção http.management.port fornece o número da porta para o componente especificado.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Como visualizar os registros

Os arquivos de registro rastreiam as mensagens relacionadas ao evento/operação do sistema. As mensagens aparecem no registro quando os processos começam e são concluídos ou quando ocorre uma condição de erro. Ao consultar os arquivos de registro, você pode ter informações sobre componentes do sistema, por exemplo, CPU, memória, disco, carga, processos e assim por diante, antes e depois de atingir um estado de falha. Isso também permite identificar e diagnosticar a origem dos problemas atuais do sistema ou ajudar a prever possíveis problemas do sistema.

Por exemplo, um registro de sistema típico de um componente contém as seguintes entradas, conforme mostrado abaixo:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

É possível editar o arquivo /opt/apigee/conf/logback.xml para controlar o mecanismo de registro sem precisar reiniciar um servidor. O arquivo logback.xml contém a seguinte propriedade que define a frequência com que o mecanismo de registro verifica o arquivo logback.xml em busca de mudanças de configuração:

<configuration scan="true" scanPeriod="30 seconds" >

Por padrão, o mecanismo de registro verifica mudanças a cada minuto. Se você omitir as unidades de tempo do atributo scanPeriod, o padrão será milissegundos.

A tabela a seguir informa o local dos arquivos de registro dos componentes da Apigee Edge para nuvem privada.

Componentes	Local
Servidor de gerenciamento	`opt/apigee/var/log/edge-management-server`
Roteador	`opt/apigee/var/log/edge-router`
processador de mensagens	`opt/apigee/var/log/edge-message-processor`
Servidor Qpid	`opt/apigee/var/log/edge-qpid-server`
Servidor Apigee Postgres	`opt/apigee/var/log/edge-postgres-server`
Interface do Edge	`opt/apigee/var/log/edge-ui`
ZooKeeper	`opt/apigee/var/log/apigee-zookeeper`
OpenLDAP	`opt/apigee/var/log/apigee-openldap`
Cassandra	`opt/apigee/var/log/apigee-cassandra`
Qpidd	`opt/apigee/var/log/apigee-qpidd`
Banco de dados PostgreSQL	`opt/apigee/var/log/apigee-postgresql`

Como ativar os registros de depuração para a interface do processador de mensagens e do Edge

Para ativar os registros de depuração do processador de mensagens:

No nó do processador de mensagens, edite /opt/apigee/customer/application/messsage-processor.properties. Se esse arquivo não existir, crie-o.
Adicione a seguinte propriedade ao arquivo:
```
conf_system_log.level=DEBUG
```

Reinicie o processador de mensagens:

/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Para ativar os registros de depuração na interface do Edge:

No nó da interface Edge, edite /opt/apigee/customer/application/ui.properties. Se esse arquivo não existir, crie-o.
Adicione a seguinte propriedade ao arquivo:
```
conf_application_logger.application=DEBUG
```

Reinicie a interface do Edge:

/opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Práticas recomendadas de apigee-monit

Ao usar apigee-monit, a Apigee recomenda:

Interromper o monitoramento de um componente antes de realizar qualquer operação que o inicie ou interrompa, como um backup ou upgrade.
Monitore o apigee-monit usando uma ferramenta como o cron. Para mais informações, consulte Monitorar apigee-monit.

Ferramentas de monitoramento

Ferramentas de monitoramento, como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit, podem ajudar você a monitorar todo o ambiente empresarial e os processos de negócios.

Componente		Nagios	Collectd	Splunk
Verificações no nível do sistema	Uso da CPU
	Memória livre/usada
	Uso de espaço em disco
	Estatísticas da rede
Processos
Verificações de API
JMX
Java
Arquivos de registro
Eventos críticos	Limite de taxa atingido
	Não é possível acessar o servidor de back-end (Hybris ou SharePoint)
	Não é possível acessar o FaaS (STS)
Eventos de alerta	Não foi possível acessar o servidor SMTP
Eventos de alerta	SLAs violados