Best practice per il monitoraggio

Edge per Private Cloud v. 4.16.09

Monitoraggio degli avvisi

Apigee Edge ti consente di inoltrare avvisi a syslog o sistemi/strumenti di monitoraggio esterni quando un errore o un errore si verifica a causa del mancato funzionamento di un evento. Questi avvisi possono essere a livello di sistema avvisi/eventi a livello di applicazione. Gli avvisi a livello di applicazione sono per lo più avvisi personalizzati vengono creati in base agli eventi generati. L'amministratore di rete solitamente configura le condizioni di traffico. Per ulteriori informazioni sugli avvisi, contatta l'assistenza Apigee.

Impostazione delle soglie di avviso

Imposta una soglia oltre la quale deve essere generato un avviso. Le impostazioni dipendono configurazione hardware. La soglia deve essere impostata in relazione alla capacità. Ad esempio, Apigee Edge potrebbe essere troppo basso se hai solo 6 GB di capacità. Puoi assegnare una soglia con un valore uguale a (=) o maggiore di (>). Puoi anche specificare un intervallo di tempo tra due la generazione di avvisi. Puoi utilizzare l'opzione ore/minuti/secondi.

Criteri per l'impostazione di avvisi a livello di sistema

Nella tabella seguente vengono descritti i criteri:

Avviso

Soglia suggerita

Descrizione

Memoria insufficiente

500MB

Il livello di memoria è troppo basso per avviare un componente

Spazio su disco insufficiente (/var/log)

8 GB

Lo spazio su disco è troppo basso.

Carico elevato

3+

I processi in attesa di esecuzione sono aumentati inaspettatamente

Processo interrotto

N/D, un valore booleano di true o false

Il processo Java di Apigee nel sistema si è interrotto

Controllo delle istanze di terze parti e specifiche per Apigee Porte

Monitora le seguenti porte per assicurarti che siano attive

  • Porta 4526, 4527 e 4528 su server di gestione, router e processore di messaggi
  • Porta 1099, 1100 e 1101 su server di gestione, router e processore di messaggi
  • Porta 8081 e 15999 sui router
  • Porta 8082 e 8998 sui processori di messaggi
  • Porta 8080 sul server di gestione

Controlla le seguenti porte di terze parti per assicurarti che siano attive:

  • Porta Qpid 5672
  • Porta Postgres 5432
  • Porta Cassandra 7000, 7199, 9042, 9160
  • Porta 2181 di ZooKeeper
  • Porta OpenLDAP 10389

Per determinare su quale porta ogni componente Apigee sta ascoltando le chiamate API, le seguenti chiamate API al server di gestione (che in genere si trova sulla porta 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

L'output di questi comandi conterrà sezioni simili a quella mostrata di seguito. La &quot;http.management.port&quot; sezione restituisce il numero di porta per il componente specificato.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Visualizzazione dei log

I file di log tengono traccia dei messaggi relativi all'evento/funzionamento del sistema. I messaggi vengono visualizzati nel log quando i processi iniziano e vengono completati o quando si verifica una condizione di errore. Visualizzando il log di sistema, puoi ottenere informazioni sui componenti del sistema, ad esempio CPU, memoria, disco, processi, così via, prima e dopo aver raggiunto uno stato di errore. Questo ti consente anche di identificare diagnosticare l'origine dei problemi di sistema attuali o aiutarti a prevedere potenziali problemi per risolvere problemi di produzione e facilità d'uso.

Ad esempio, un tipico log di sistema di un componente contiene le seguenti voci, come illustrato di seguito:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Puoi modificare il file /<inst_root>/apigee/conf/logback.xml per controllare il logging senza dover riavviare il server. Il file logback.xml contiene quanto segue che imposta la frequenza con cui il meccanismo di logging controlla il file logback.xml modifiche alla configurazione:

<configuration scan="true" scanPeriod="30 seconds" >

Per impostazione predefinita, il meccanismo di logging controlla le modifiche ogni minuto. Se ometti le unità di tempo all'attributo scanPeriod, il valore predefinito è millisecondi.

La tabella seguente indica la posizione dei file di log dei componenti del cloud privato di Apigee Edge.

Componenti

Località

Server di gestione

&lt;inst_root&gt;/apigee/var/log/edge-management-server

Router

&lt;inst_root&gt;/apigee/var/log/edge-router

processore di messaggi

&lt;inst_root&gt;/apigee/var/log/edge-message-processor

Server Qpid

&lt;inst_root&gt;/apigee/var/log/edge-qpid-server

Server Apigee Postgres

&lt;inst_root&gt;/apigee/var/log/edge-postgres-server

UI Edge

&lt;inst_root&gt;/apigee/var/log/edge-ui

ZooKeeper

&lt;inst_root&gt;/apigee/var/log/apigee-zookeeper

OpenLDAP

&lt;inst_root&gt;/apigee/var/log/apigee-openldap

Cassandra

&lt;inst_root&gt;/apigee/var/log/apigee-cassandra

Qpidd

&lt;inst_root&gt;/apigee/var/log/apigee-qpidd

Database PostgreSQL

&lt;inst_root&gt;/apigee/var/log/apigee-postgresql

Abilitazione dei log di debug per il messaggio Processore e UI perimetrale

Per abilitare i log di debug per il processore di messaggi:

  1. Sul nodo del processore di messaggi, modifica /&lt;install_dir&gt;/apigee/customer/application/messsage-processor.properties. Se il file non esiste, crealo.
  2. Aggiungi la seguente proprietà al file:
    conf_system_log.level=DEBUG
  3. Riavvia il processore di messaggi:
    &gt; /<install_dir>/apigee/apigee-service/bin/apigee-service edge-message-processor riavvia

Per abilitare i log di debug per la UI Edge:

  1. Sul nodo dell'interfaccia utente Edge, modifica /&lt;install_dir&gt;/apigee/customer/application/ui.properties. Se il file non esiste, crealo.
  2. Aggiungi la seguente proprietà al file:
    conf_application_logger.application=DEBUG
  3. Riavvia la UI Edge:
    &gt; /<install_dir>/apigee/apigee-service/bin/apigee-service edge-ui riavvio

Strumenti di monitoraggio

Gli strumenti di monitoraggio open source come Nagios, Collectd, Graphite, Splunk, Sumologic e Monit può aiutarti a monitorare l'intero ambiente e i processi aziendali.

Componente

Nagios

Raccolta

Splunk

Controlli a livello di sistema

Utilizzo CPU

?

?

Memoria libera/utilizzata

?

?

Utilizzo spazio su disco

?

?

Statistiche di rete

?

?

Processi

?

Controlli delle API

?

JMX

?

Java

?

File di log

?

Eventi critici

Raggiungimento del limite di frequenza

?

Impossibile raggiungere il server di backend (Hybris o SharePoint)

?

Impossibile raggiungere FaaS (STS)

?

Eventi di avviso

Impossibile raggiungere il server SMTP

?

SLA violati

?