Best practice per il monitoraggio

Edge per Private Cloud v4.18.05

Avvisi di monitoraggio

Apigee Edge ti consente di inoltrare avvisi a syslog o sistemi/strumenti di monitoraggio esterni quando un errore o un errore si verifica a causa del mancato funzionamento di un evento. Questi avvisi possono essere a livello di sistema avvisi/eventi a livello di applicazione. Gli avvisi a livello di applicazione sono per lo più avvisi personalizzati vengono creati in base agli eventi generati. L'amministratore di rete solitamente configura le condizioni di traffico. Per ulteriori informazioni sugli avvisi, contatta l'assistenza Apigee.

Impostazione delle soglie di avviso

Imposta una soglia oltre la quale deve essere generato un avviso. Le impostazioni dipendono configurazione hardware. La soglia deve essere impostata in relazione alla capacità. Ad esempio, Apigee Edge potrebbe essere troppo basso se hai solo 6 GB di capacità. Puoi assegnare una soglia con un valore uguale a (=) o maggiore di (>). Puoi anche specificare un intervallo di tempo tra due la generazione di avvisi. Puoi utilizzare l'opzione ore/minuti/secondi.

Criteri per l'impostazione di avvisi a livello di sistema

Nella tabella seguente vengono descritti i criteri:

Alert Soglia suggerita Descrizione

Memoria insufficiente

500MB

Il livello di memoria è troppo basso per avviare un componente

Spazio su disco insufficiente (/var/log)

8 GB

Lo spazio su disco è troppo basso.

Carico elevato

3+

I processi in attesa di esecuzione sono aumentati inaspettatamente

Processo interrotto

N/D, un valore booleano di true o false

Il processo Java di Apigee nel sistema si è interrotto

Controllo delle istanze di terze parti e specifiche per Apigee Porte

Monitora le seguenti porte per assicurarti che siano attive

  • Porta 4526, 4527 e 4528 su server di gestione, router e processore di messaggi
  • Porta 1099, 1100 e 1101 su server di gestione, router e processore di messaggi
  • Porta 8081 e 15999 sui router
  • Porta 8082 e 8998 sui processori di messaggi
  • Porta 8080 sul server di gestione

Controlla le seguenti porte di terze parti per assicurarti che siano attive:

  • Porta Qpid 5672
  • Porta Postgres 5432
  • Porta Cassandra 7000, 7199, 9042, 9160
  • Porta 2181 di ZooKeeper
  • Porta OpenLDAP 10389

Per determinare su quale porta ogni componente Apigee sta ascoltando le chiamate API, le seguenti chiamate API al server di gestione (che in genere si trova sulla porta 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

L'output di questi comandi conterrà sezioni simili a quella mostrata di seguito. La La sezione http.management.port indica il numero di porta per il componente specificato.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualizzazione dei log

I file di log tengono traccia dei messaggi relativi all'evento/funzionamento del sistema. I messaggi vengono visualizzati nel log quando i processi iniziano e vengono completati o quando si verifica una condizione di errore. Visualizzando il log di sistema, puoi ottenere informazioni sui componenti del sistema, ad esempio CPU, memoria, disco, processi, così via, prima e dopo aver raggiunto uno stato di errore. Questo ti consente anche di identificare diagnosticare l'origine dei problemi di sistema attuali o aiutarti a prevedere potenziali problemi per risolvere problemi di produzione e facilità d'uso.

Ad esempio, un tipico log di sistema di un componente contiene le seguenti voci, come illustrato di seguito:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puoi modificare il file /opt/apigee/conf/logback.xml per controllare il meccanismo di logging senza dover riavviare un server. Il file logback.xml contiene la seguente proprietà che imposta la frequenza con cui il meccanismo di logging controlla se nel file logback.xml sono presenti modifiche alla configurazione:

<configuration scan="true" scanPeriod="30 seconds" >

Per impostazione predefinita, il meccanismo di logging controlla le modifiche ogni minuto. Se ometti le unità di tempo all'attributo scanPeriod, il valore predefinito è millisecondi.

La tabella seguente indica la posizione dei file di log dei componenti del cloud privato di Apigee Edge.

Componenti Località

Server di gestione

opt/apigee/var/log/edge-management-server

Router

opt/apigee/var/log/edge-router

processore di messaggi

opt/apigee/var/log/edge-message-processor

Server Qpid

opt/apigee/var/log/edge-qpid-server

Server Apigee Postgres

opt/apigee/var/log/edge-postgres-server

UI Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Database PostgreSQL

opt/apigee/var/log/apigee-postgresql

Abilitazione dei log di debug per il messaggio Processore e UI perimetrale

Per abilitare i log di debug per il processore di messaggi:

  1. Sul nodo del processore di messaggi, modifica /opt/apigee/customer/application/messsage-processor.properties. Se il file non esiste, devi crearlo.
  2. Aggiungi la seguente proprietà al file:
    conf_system_log.level=DEBUG
  3. Riavvia il processore di messaggi:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Per abilitare i log di debug per la UI Edge:

  1. Sul nodo UI perimetrale, modifica /opt/apigee/customer/application/ui.properties. Se il file non esiste, crealo.
  2. Aggiungi la seguente proprietà al file:
    conf_application_logger.application=DEBUG
  3. Riavvia la UI Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Strumenti di monitoraggio

Strumenti di monitoraggio come Nagios, Collectd, Graphite, Splunk, Sumologic e Monit possono aiutarti monitorare tutto l'ambiente e i processi aziendali.

Componente Nagios RACCOLTE Splunk

Controlli a livello di sistema

Utilizzo CPU

Memoria libera/utilizzata

Utilizzo spazio su disco

Statistiche di rete

Processi

Controlli delle API

JMX

Java

File di log

Eventi critici

Raggiungimento del limite di frequenza

Impossibile raggiungere il server di backend (Hybris o SharePoint)

Impossibile raggiungere FaaS (STS)

Eventi di avviso

Impossibile raggiungere il server SMTP

SLA violati