Best practice per il monitoraggio

Edge per Private Cloud v. 4.16.09

Avvisi di monitoraggio

Apigee Edge consente di inoltrare avvisi a syslog o sistemi/strumenti di monitoraggio esterni quando si verifica un errore o un guasto dovuto a un errore di un evento. Questi avvisi possono essere avvisi/eventi a livello di sistema o di applicazione. Gli avvisi a livello di applicazione sono principalmente avvisi personalizzati che vengono creati in base agli eventi generati. In genere l'amministratore di rete configura le condizioni personalizzate. Per ulteriori informazioni sugli avvisi, contatta l'assistenza Apigee.

Impostazione delle soglie di avviso

Imposta una soglia dopo la quale deve essere generato un avviso. L'impostazione dipende dalla configurazione hardware. La soglia deve essere impostata in relazione alla capacità. Ad esempio, Apigee Edge potrebbe essere troppo basso se hai solo 6 GB di capacità. Puoi assegnare una soglia con il criterio uguale a (=) o maggiore di (>). Puoi anche specificare un intervallo di tempo tra due generazioni di avvisi consecutivi. Puoi utilizzare l'opzione ore/minuti/secondi.

Criteri per l'impostazione degli avvisi a livello di sistema

La tabella seguente descrive i criteri:

Avviso

Soglia suggerita

Descrizione

Memoria insufficiente

500MB

Memoria insufficiente per avviare un componente

Spazio su disco insufficiente (/var/log)

8 GB

Lo spazio sul disco è insufficiente.

Carico elevato

3+

I processi in attesa di esecuzione sono aumentati in modo imprevisto

Processo interrotto

N/D, un valore booleano vero o falso

Il processo Java di Apigee nel sistema è stato interrotto

Controllo delle porte specifiche di Apigee e di terze parti

Monitora le seguenti porte per assicurarti che siano attive

  • Porte 4526, 4527 e 4528 sul server di gestione, sul router e sul processore di messaggi
  • Porte 1099, 1100 e 1101 su server di gestione, router e processore di messaggi
  • Porte 8081 e 15999 sui router
  • Porte 8082 e 8998 sui processori di messaggi
  • Porta 8080 sul server di gestione

Controlla che le porte di terze parti riportate di seguito siano attive:

  • Porta Qpid 5672
  • Porta Postgres 5432
  • Porta Cassandra 7000, 7199, 9042, 9160
  • Porta 2181 ZooKeeper
  • Porta OpenLDAP 10389

Per determinare su quale porta ogni componente Apigee è in ascolto delle chiamate API, esegui le seguenti chiamate API al server di gestione (che in genere si trova sulla porta 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

L'output di questi comandi conterrà sezioni simili a quella mostrata di seguito. La sezione "http.management.port" indica il numero di porta per il componente specificato.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualizzazione dei log

I file di log tengono traccia dei messaggi relativi all'evento o al funzionamento del sistema. I messaggi vengono visualizzati nel log quando i processi iniziano e vengono completati o quando si verifica una condizione di errore. Visualizzando i file di log, puoi ottenere informazioni sui componenti del sistema, ad esempio CPU, memoria, disco, carico, processi e così via, prima e dopo il raggiungimento di uno stato di errore. In questo modo puoi anche identificare e diagnosticare l'origine dei problemi attuali del sistema o prevedere potenziali problemi di sistema.

Ad esempio, un log di sistema tipico di un componente contiene le seguenti voci:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puoi modificare il file /<inst_root>/apigee/conf/logback.xml per controllare il meccanismo di logging senza dover riavviare un server. Il file logback.xml contiene la seguente proprietà che imposta la frequenza con cui il meccanismo di logging controlla il file logback.xml per verificare la presenza di modifiche alla configurazione:

<configuration scan="true" scanPeriod="30 seconds" >

Per impostazione predefinita, il meccanismo di logging verifica la presenza di modifiche ogni minuto. Se ometti le unità di tempo nell'attributo scanPeriod, il valore predefinito è in millisecondi.

La tabella seguente indica la posizione dei file di log dei componenti Private Cloud di Apigee Edge.

Componenti

Posizione

Server di gestione

<inst_root>/apigee/var/log/edge-management-server

Router

<inst_root>/apigee/var/log/edge-router

processore di messaggi

<inst_root>/apigee/var/log/edge-message-processor

Server Qpid

<inst_root>/apigee/var/log/edge-qpid-server

Server Apigee Postgres

<inst_root>/apigee/var/log/edge-postgres-server

UI perimetrale

<inst_root>/apigee/var/log/edge-ui

ZooKeeper

<inst_root>/apigee/var/log/apigee-zookeeper

OpenLDAP

<inst_root>/apigee/var/log/apigee-openldap

Cassandra

<inst_root>/apigee/var/log/apigee-cassandra

Qpidd

<inst_root>/apigee/var/log/apigee-qpidd

Database PostgreSQL

<inst_root>/apigee/var/log/apigee-postgresql

Abilitazione dei log di debug per il processore di messaggi e la UI perimetrale

Per attivare i log di debug per il processore di messaggi:

  1. Nel nodo del processore di messaggi, modifica /<install_dir>/apigee/customer/application/messsage-processor.properties. Se il file non esiste, crealo.
  2. Aggiungi la seguente proprietà al file:
    conf_system_log.level=DEBUG
  3. Riavvia il processore di messaggi:
    > /<install_dir>/apigee/apigee-service/bin/apigee-service edge-message-processor reboot

Per abilitare i log di debug per la UI Edge:

  1. Nel nodo UI perimetrale, modifica /<install_dir>/apigee/customer/application/ui.properties. Se il file non esiste, crealo.
  2. Aggiungi la seguente proprietà al file:
    conf_application_logger.application=DEBUG
  3. Riavvia l'interfaccia utente Edge:
    > /<install_dir>/apigee/apigee-service/bin/apigee-service edge-ui restart

Strumenti di monitoraggio

Gli strumenti di monitoraggio open source come Nagios, Collectd, Graphite, Splunk, Sumologic e Monit possono aiutarti a monitorare l'intero ambiente aziendale e i processi aziendali.

Componente

Nagio

Raccolta

Splunk

Controlli a livello di sistema

Utilizzo CPU

?

?

Memoria libera/utilizzata

?

?

Utilizzo spazio su disco

?

?

Statistiche di rete

?

?

Processi

?

Controlli API

?

JMX

?

Java

?

File di log

?

Eventi critici

Hit limite di frequenza

?

Impossibile raggiungere il server di backend (Hybris o SharePoint)

?

Impossibile raggiungere FaaS (STS)

?

Eventi di avviso

Impossibile raggiungere il server SMTP

?

SLA (accordo sul livello del servizio) violati

?