Best practice per il monitoraggio

Avvisi di monitoraggio

Apigee Edge ti consente di inoltrare gli avvisi a syslog o a sistemi/strumenti di monitoraggio esterni quando si verifica un errore o un malfunzionamento a causa del fallimento di un evento. Questi avvisi possono essere avvisi/eventi a livello di sistema o di applicazione. Gli avvisi a livello di applicazione sono per lo più avvisi personalizzati creati in base agli eventi generati. In genere, le condizioni personalizzate vengono configurate dall'amministratore di rete. Per ulteriori informazioni sugli avvisi, contatta l'assistenza Apigee.

Impostazione delle soglie di avviso

Imposta una soglia oltre la quale deve essere generato un avviso. Ciò che imposti dipende dalla configurazione hardware. La soglia deve essere impostata in base alla tua capacità. Ad esempio, Apigee Edge potrebbe essere troppo basso se hai una capacità di soli 6 GB. Puoi assegnare una soglia con un criterio uguale a (=) o maggiore di (>). Puoi anche specificare un intervallo di tempo tra due generazioni di avvisi consecutivi. Puoi utilizzare l'opzione ore/minuti/secondi.

Criteri per l'impostazione di avvisi a livello di sistema

La seguente tabella descrive i criteri:

Avviso Soglia suggerita Descrizione

Memoria insufficiente

500MB

La memoria è troppo bassa per avviare un componente

Spazio su disco insufficiente (/var/log)

8 GB

Lo spazio su disco è troppo basso.

Carico elevato

3+

I processi in attesa di esecuzione sono aumentati in modo imprevisto

Processo interrotto

N/A, un valore booleano di true o false

Il processo Java di Apigee nel sistema si è interrotto

Controllo delle porte Apigee specifiche e di terze parti

Monitora le seguenti porte per assicurarti che siano attive

  • Porte 4526, 4527 e 4528 sul server di gestione, sul router e sull'elaboratore di messaggi
  • Porte 1099, 1100 e 1101 su server di gestione, router ed elaboratore di messaggi
  • Porte 8081 e 15999 sui router
  • Porta 8082 e 8998 sui processori di messaggi
  • Porta 8080 sul server di gestione

Controlla le seguenti porte di terze parti per assicurarti che siano attive:

  • Porta Qpid 5672
  • Porta Postgres 5432
  • Porta Cassandra 7000, 7199, 9042, 9160
  • Porta ZooKeeper 2181
  • Porta OpenLDAP 10389

Per determinare su quale porta ogni componente Apigee è in ascolto per le chiamate API, emetti le seguenti chiamate API al server di gestione (in genere sulla porta 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

L'output di questi comandi conterrà sezioni simili a quella mostrata di seguito. La sezione http.management.port indica il numero di porta per il componente specificato.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualizzazione dei log

I file di log monitorano i messaggi relativi all'evento/all'operazione del sistema. I messaggi vengono visualizzati nel log quando i processi iniziano e terminano o quando si verifica una condizione di errore. Se visualizzi i file di log, puoi ottenere informazioni sui componenti di sistema, ad esempio CPU, memoria, disco, caricamento, processi e così via, prima e dopo aver raggiunto uno stato di errore. In questo modo puoi anche identificare e diagnosticare la causa dei problemi attuali del sistema o prevedere potenziali problemi del sistema.

Ad esempio, un tipico log di sistema di un componente contiene le seguenti voci:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puoi modificare il file /opt/apigee/conf/logback.xml per controllare il meccanismo di registrazione senza dover riavviare un server. Il file logback.xml contiene la seguente proprietà che imposta la frequenza con cui il meccanismo di registrazione controlla il file logback.xml per verificare la presenza di modifiche alla configurazione:

<configuration scan="true" scanPeriod="30 seconds" >

Per impostazione predefinita, il meccanismo di registrazione controlla le modifiche ogni minuto. Se ometti le unità di tempo per l'attributo scanPeriod, il valore predefinito è millisecondi.

La tabella seguente indica la posizione dei file di log dei componenti di Apigee Edge Private Cloud.

Componenti Località

Server di gestione

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

processore di messaggi

opt/apigee/var/log/edge-message-processor

Qpid Server

opt/apigee/var/log/edge-qpid-server

Apigee Postgres Server

opt/apigee/var/log/edge-postgres-server

Interfaccia utente Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Database PostgreSQL

opt/apigee/var/log/apigee-postgresql

Attivazione dei log di debug per il processore di messaggi e l'interfaccia utente di Edge

Per attivare i log di debug per il processore di messaggi:

  1. Nel nodo del processore dei messaggi, modifica /opt/apigee/customer/application/messsage-processor.properties. Se il file non esiste, crealo.
  2. Aggiungi la proprietà seguente al file:
    conf_system_log.level=DEBUG
  3. Riavvia il processore di messaggi:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Per attivare i log di debug per l'interfaccia utente di Edge:

  1. Nel nodo UI Edge, modifica /opt/apigee/customer/application/ui.properties. Se il file non esiste, creane uno.
  2. Aggiungi la proprietà seguente al file:
    conf_application_logger.application=DEBUG
  3. Riavvia l'interfaccia utente di Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Best practice di apigee-monit

Quando utilizzi apigee-monit, Apigee consiglia di:

Strumenti di monitoraggio

Strumenti di monitoraggio come Nagios, Collectd, Graphite, Splunk, Sumologic e Monit possono aiutarti a monitorare l'intero ambiente aziendale e i processi aziendali.

Componente Nagios Collectd Splunk

Controlli a livello di sistema

Utilizzo CPU

Memoria libera/utilizzata

Utilizzo spazio su disco

Statistiche di rete

Processi

Controlli API

JMX

Java

File di log

Eventi critici

Hit del limite di frequenza

Impossibile raggiungere il server di backend (Hybris o SharePoint)

Impossibile raggiungere FaaS (STS)

Eventi di avviso

Il server SMTP non è raggiungibile

SLA violati