Alertas de monitoramento
O Apigee Edge permite encaminhar alertas para syslogs ou sistemas/ferramentas de monitoramento externo quando ocorre um erro ou uma falha devido à falha de um evento. Esses alertas podem ser do sistema ou do aplicativo. Os alertas no nível do aplicativo são, em sua maioria, alertas personalizados criados com base nos eventos gerados. O administrador de rede geralmente configura as condições personalizadas. Para mais informações sobre alertas, entre em contato com o suporte da Apigee.
Definir limites de alerta
Defina um limite após o qual um alerta precisa ser gerado. O que você define depende da configuração do hardware. O limite precisa ser definido em relação à sua capacidade. Por exemplo, o Apigee Edge pode ser muito baixo se você tiver apenas 6 GB de capacidade. É possível atribuir o limite com o critério igual a (=) ou maior que (>). Também é possível especificar um intervalo de tempo entre duas gerações de alertas consecutivas. Você pode usar a opção de horas/minutos/segundos.
Critérios para definir alertas no nível do sistema
A tabela a seguir descreve os critérios:
Alerta | Limite sugerido | Descrição |
---|---|---|
Pouca memória |
500 MB |
A memória está muito baixa para iniciar um componente |
Pouco espaço em disco (/var/log) |
8 GB |
O espaço em disco está muito baixo. |
Carga alta |
3+ |
Os processos que aguardam a execução aumentaram inesperadamente |
Processo interrompido |
N/A, um valor booleano de verdadeiro ou falso |
O processo do Java da Apigee no sistema foi interrompido |
Como verificar portas específicas da Apigee e de terceiros
Monitore as portas a seguir para garantir que elas estejam ativas
- Portas 4526, 4527 e 4528 no servidor de gerenciamento, no roteador e no processador de mensagens
- Portas 1099, 1100 e 1101 no servidor de gerenciamento, no roteador e no processador de mensagens
- Portas 8081 e 15999 em roteadores
- Portas 8082 e 8998 em processadores de mensagens
- Porta 8080 no servidor de gerenciamento
Verifique se as portas de terceiros a seguir estão ativas:
- Porta Qpid 5672
- Porta 5432 do Postgres
- Porta do Cassandra 7000, 7199, 9042, 9160
- Porta 2181 do ZooKeeper
- Porta 10389 do OpenLDAP
Para determinar em qual porta cada componente do Apigee está detectando chamadas de API, emita as seguintes chamadas de API para o servidor de gerenciamento (geralmente na porta 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
A saída desses comandos vai conter seções semelhantes à mostrada abaixo. A
seção http.management.port
fornece o número da porta para o componente especificado.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Como visualizar os registros
Os arquivos de registro rastreiam as mensagens relacionadas ao evento/operação do sistema. As mensagens aparecem no registro quando os processos começam e são concluídos ou quando ocorre uma condição de erro. Ao consultar os arquivos de registro, você pode ter informações sobre componentes do sistema, por exemplo, CPU, memória, disco, carga, processos e assim por diante, antes e depois de atingir um estado de falha. Isso também permite identificar e diagnosticar a origem dos problemas atuais do sistema ou ajudar a prever possíveis problemas do sistema.
Por exemplo, um registro de sistema típico de um componente contém as seguintes entradas, conforme mostrado abaixo:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
É possível editar o arquivo /opt/apigee/conf/logback.xml
para controlar o mecanismo de registro sem
precisar reiniciar um servidor. O arquivo logback.xml contém a seguinte propriedade que define a
frequência com que o mecanismo de registro verifica o arquivo logback.xml em busca de mudanças de configuração:
<configuration scan="true" scanPeriod="30 seconds" >
Por padrão, o mecanismo de registro verifica mudanças a cada minuto. Se você omitir as unidades de tempo
do atributo scanPeriod
, o padrão será milissegundos.
A tabela a seguir informa o local dos arquivos de registro dos componentes da Apigee Edge para nuvem privada.
Componentes | Local |
---|---|
Servidor de gerenciamento |
|
Roteador |
|
processador de mensagens |
|
Servidor Qpid |
|
Servidor Apigee Postgres |
|
Interface do Edge |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
Banco de dados PostgreSQL |
|
Como ativar os registros de depuração para a interface do processador de mensagens e do Edge
Para ativar os registros de depuração do processador de mensagens:
- No nó do processador de mensagens, edite
/opt/apigee/customer/application/messsage-processor.properties
. Se esse arquivo não existir, crie-o. - Adicione a seguinte propriedade ao arquivo:
conf_system_log.level=DEBUG
- Reinicie o processador de mensagens:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Para ativar os registros de depuração na interface do Edge:
- No nó da interface Edge, edite
/opt/apigee/customer/application/ui.properties
. Se esse arquivo não existir, crie-o. - Adicione a seguinte propriedade ao arquivo:
conf_application_logger.application=DEBUG
- Reinicie a interface do Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
Práticas recomendadas de apigee-monit
Ao usar apigee-monit
, a Apigee recomenda:
- Interromper o monitoramento de um componente antes de realizar qualquer operação que o inicie ou interrompa, como um backup ou upgrade.
- Monitore o
apigee-monit
usando uma ferramenta como ocron
. Para mais informações, consulte Monitorar apigee-monit.
Ferramentas de monitoramento
Ferramentas de monitoramento, como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit, podem ajudar você a monitorar todo o ambiente empresarial e os processos de negócios.
Componente | Nagios | Collectd | Splunk | |
---|---|---|---|---|
Verificações no nível do sistema |
Uso da CPU |
|||
Memória livre/usada |
||||
Uso de espaço em disco |
||||
Estatísticas da rede |
||||
Processos |
|
|
||
Verificações de API |
||||
JMX |
||||
Java |
||||
Arquivos de registro |
||||
Eventos críticos |
Limite de taxa atingido |
|||
Não é possível acessar o servidor de back-end (Hybris ou SharePoint) |
||||
Não é possível acessar o FaaS (STS) |
||||
Eventos de alerta |
Não foi possível acessar o servidor SMTP |
|||
SLAs violados |