Alertas de monitoramento
O Apigee Edge permite encaminhar alertas para syslogs ou sistemas/ferramentas de monitoramento externos quando ocorre um erro ou uma falha devido à falha de um evento. Esses alertas podem ser de nível do sistema ou de nível do aplicativo/eventos. Os alertas no nível do aplicativo são principalmente alertas personalizados criados com base em eventos gerados. Normalmente, o administrador de rede configura as condições personalizadas. Para mais informações sobre alertas, entre em contato com o suporte da Apigee.
Definir limites de alerta
Defina um limite para que um alerta seja gerado. O que você define depende da sua configuração de hardware. O limite precisa ser definido em relação à sua capacidade. Por exemplo, o Apigee Edge pode ser muito baixo se você tiver apenas 6 GB de capacidade. Você pode atribuir um limite com o critério "igual a (=)" ou "maior que (>)". Também é possível especificar um intervalo de tempo entre duas gerações consecutivas de alertas. Você pode usar a opção horas/minutos/segundos.
Critérios para definir alertas no nível do sistema
A tabela a seguir descreve os critérios:
Alerta | Limite sugerido | Descrição |
---|---|---|
Pouca memória |
500 MB |
A memória é muito baixa para iniciar um componente |
Pouco espaço em disco (/var/log) |
8 GB |
O espaço em disco está muito baixo. |
Carga alta |
3+ |
O número de processos aguardando execução aumentou inesperadamente |
Processo interrompido |
Não aplicável, um valor booleano verdadeiro ou falso |
O processo Java da Apigee no sistema foi interrompido |
Como verificar portas específicas da Apigee e de terceiros
Monitore as seguintes portas para garantir que elas estejam ativas:
- Portas 4526, 4527 e 4528 no servidor de gerenciamento, roteador e processador de mensagens
- Portas 1099, 1100 e 1101 no servidor de gerenciamento, roteador e processador de mensagens
- Portas 8081 e 15999 em roteadores
- Portas 8082 e 8998 nos processadores de mensagens
- Porta 8080 no servidor de gerenciamento
Verifique se as seguintes portas de terceiros estão ativas:
- Porta Qpid 5672
- Porta 5432 do Postgres
- Portas 7000, 7199, 9042 e 9160 do Cassandra
- Porta 2181 do ZooKeeper
- Porta 10389 do SymasLDAP
Para determinar em qual porta cada componente do Apigee está detectando chamadas de API, execute as seguintes chamadas de API para o servidor de gerenciamento (geralmente na porta 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
A saída desses comandos vai conter seções semelhantes à mostrada abaixo. A seção
http.management.port
informa o número da porta do componente especificado.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Como visualizar os registros
Os arquivos de registro acompanham as mensagens relacionadas ao evento/operação do sistema. As mensagens aparecem no registro quando os processos começam e terminam ou quando ocorre uma condição de erro. Ao visualizar arquivos de registro, é possível obter informações sobre componentes do sistema, como CPU, memória, disco, carga, processos e assim por diante, antes e depois de atingir um estado de falha. Isso também permite identificar e diagnosticar a origem dos problemas atuais do sistema ou ajudar a prever possíveis problemas.
Por exemplo, um registro de sistema típico de um componente contém as seguintes entradas, conforme mostrado abaixo:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
É possível editar o arquivo /opt/apigee/conf/logback.xml
para controlar o mecanismo de geração de registros sem
precisar reiniciar um servidor. O arquivo logback.xml contém a seguinte propriedade, que define a frequência com que o mecanismo de geração de registros verifica o arquivo logback.xml em busca de mudanças na configuração:
<configuration scan="true" scanPeriod="30 seconds" >
Por padrão, o mecanismo de geração de registros verifica mudanças a cada minuto. Se você omitir as unidades de tempo no atributo scanPeriod
, o padrão será milissegundos.
A tabela a seguir informa a localização dos arquivos de registro dos componentes da Apigee Edge para nuvem privada.
Componentes | Local |
---|---|
Servidor de gerenciamento |
|
Roteador |
|
processador de mensagens |
|
Servidor Qpid |
|
Servidor Postgres da Apigee |
|
Interface do Edge |
|
ZooKeeper |
|
SymasLDAP |
|
Cassandra |
|
Qpidd |
|
Banco de dados PostgreSQL |
|
Como ativar registros de depuração para o processador de mensagens e a interface do Edge
Para ativar os registros de depuração do processador de mensagens:
- No nó do Message Processor, edite
/opt/apigee/customer/application/message-processor.properties
. Se ele não existir, crie-o. - Adicione a seguinte propriedade ao arquivo:
conf_system_log.level=DEBUG
- Reinicie o processador de mensagens:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Para ativar os registros de depuração na interface do Edge:
- No nó da interface do Edge, edite
/opt/apigee/customer/application/ui.properties
. Se ele não existir, crie-o. - Adicione a seguinte propriedade ao arquivo:
conf_application_logger.application=DEBUG
- Reinicie a interface do Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
Práticas recomendadas do apigee-monit
Ao usar apigee-monit
, a Apigee recomenda que você:
- Pare de monitorar um componente antes de realizar qualquer operação que o inicie ou pare, como um backup ou um upgrade.
- Monitore o
apigee-monit
usando uma ferramenta como ocron
. Para mais informações, consulte Monitorar o apigee-monit.
Ferramentas de monitoramento
Ferramentas de monitoramento como Nagios, Collectd, Graphite, Splunk, Sumologic e Monit podem ajudar você a monitorar todo o ambiente empresarial e os processos de negócios.
Componente | Nagios | Collectd | Splunk | |
---|---|---|---|---|
Verificações no nível do sistema |
Uso da CPU |
|||
Memória livre/usada |
||||
Uso de espaço em disco |
||||
Estatísticas da rede |
||||
Processos |
|
|
||
Verificações de API |
||||
JMX |
||||
Java |
||||
Arquivos de registro |
||||
Eventos críticos |
Limite de taxa atingido |
|||
Não é possível acessar o servidor de back-end (Hybris ou SharePoint) |
||||
Não é possível acessar o FaaS (STS) |
||||
Eventos de alerta |
Não foi possível acessar o servidor SMTP |
|||
SLAs violados |