Avvisi di monitoraggio
Apigee Edge ti consente di inoltrare avvisi a syslog o sistemi/strumenti di monitoraggio esterni quando un errore o un errore si verifica a causa del mancato funzionamento di un evento. Questi avvisi possono essere a livello di sistema avvisi/eventi a livello di applicazione. Gli avvisi a livello di applicazione sono per lo più avvisi personalizzati vengono creati in base agli eventi generati. L'amministratore di rete solitamente configura le condizioni di traffico. Per ulteriori informazioni sugli avvisi, contatta l'assistenza Apigee.
Impostazione delle soglie di avviso
Imposta una soglia oltre la quale deve essere generato un avviso. Le impostazioni dipendono configurazione hardware. La soglia deve essere impostata in relazione alla capacità. Ad esempio, Apigee Edge potrebbe essere troppo basso se hai solo 6 GB di capacità. Puoi assegnare una soglia con un valore uguale a (=) o maggiore di (>). Puoi anche specificare un intervallo di tempo tra due la generazione di avvisi. Puoi utilizzare l'opzione ore/minuti/secondi.
Criteri per l'impostazione di avvisi a livello di sistema
Nella tabella seguente vengono descritti i criteri:
Alert | Soglia suggerita | Descrizione |
---|---|---|
Memoria insufficiente |
500MB |
Il livello di memoria è troppo basso per avviare un componente |
Spazio su disco insufficiente (/var/log) |
8 GB |
Lo spazio su disco è troppo basso. |
Carico elevato |
3+ |
I processi in attesa di esecuzione sono aumentati inaspettatamente |
Processo interrotto |
N/D, un valore booleano di true o false |
Il processo Java di Apigee nel sistema si è interrotto |
Controllo delle istanze di terze parti e specifiche per Apigee Porte
Monitora le seguenti porte per assicurarti che siano attive
- Porta 4526, 4527 e 4528 su server di gestione, router e processore di messaggi
- Porta 1099, 1100 e 1101 su server di gestione, router e processore di messaggi
- Porta 8081 e 15999 sui router
- Porta 8082 e 8998 sui processori di messaggi
- Porta 8080 sul server di gestione
Controlla le seguenti porte di terze parti per assicurarti che siano attive:
- Porta Qpid 5672
- Porta Postgres 5432
- Porta Cassandra 7000, 7199, 9042, 9160
- Porta 2181 di ZooKeeper
- Porta OpenLDAP 10389
Per determinare su quale porta ogni componente Apigee sta ascoltando le chiamate API, le seguenti chiamate API al server di gestione (che in genere si trova sulla porta 8080):
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
L'output di questi comandi conterrà sezioni simili a quella mostrata di seguito. La
La sezione http.management.port
indica il numero di porta per il componente specificato.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Visualizzazione dei log
I file di log tengono traccia dei messaggi relativi all'evento/funzionamento del sistema. I messaggi vengono visualizzati nel log quando i processi iniziano e vengono completati o quando si verifica una condizione di errore. Visualizzando il log di sistema, puoi ottenere informazioni sui componenti del sistema, ad esempio CPU, memoria, disco, processi, così via, prima e dopo aver raggiunto uno stato di errore. Questo ti consente anche di identificare diagnosticare l'origine dei problemi di sistema attuali o aiutarti a prevedere potenziali problemi per risolvere problemi di produzione e facilità d'uso.
Ad esempio, un tipico log di sistema di un componente contiene le seguenti voci, come illustrato di seguito:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Puoi modificare il file /opt/apigee/conf/logback.xml
per controllare il meccanismo di logging senza
dover riavviare un server. Il file logback.xml contiene la seguente proprietà che imposta la
frequenza con cui il meccanismo di logging controlla se nel file logback.xml sono presenti modifiche alla configurazione:
<configuration scan="true" scanPeriod="30 seconds" >
Per impostazione predefinita, il meccanismo di logging controlla le modifiche ogni minuto. Se ometti le unità di tempo
all'attributo scanPeriod
, il valore predefinito è millisecondi.
La tabella seguente indica la posizione dei file di log dei componenti del cloud privato di Apigee Edge.
Componenti | Località |
---|---|
Server di gestione |
|
Router |
|
processore di messaggi |
|
Server Qpid |
|
Server Apigee Postgres |
|
UI Edge |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
Database PostgreSQL |
|
Abilitazione dei log di debug per il messaggio Processore e UI perimetrale
Per abilitare i log di debug per il processore di messaggi:
- Sul nodo del processore di messaggi, modifica
/opt/apigee/customer/application/messsage-processor.properties
. Se il file non esiste, devi crearlo. - Aggiungi la seguente proprietà al file:
conf_system_log.level=DEBUG
- Riavvia il processore di messaggi:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Per abilitare i log di debug per la UI Edge:
- Sul nodo UI perimetrale, modifica
/opt/apigee/customer/application/ui.properties
. Se il file non esiste, crealo. - Aggiungi la seguente proprietà al file:
conf_application_logger.application=DEBUG
- Riavvia la UI Edge:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
Best practice per apigee-monit
Quando utilizzi apigee-monit
, Apigee ti consiglia di:
- Interrompi il monitoraggio di un componente prima di eseguire qualsiasi un'operazione che lo avvia o lo interrompe, ad esempio un backup o un upgrade.
- Monitora
apigee-monit
con uno strumento comecron
. Per ulteriori informazioni informazioni, vedi Monitor apigee-monit.
Strumenti di monitoraggio
Strumenti di monitoraggio come Nagios, Collectd, Graphite, Splunk, Sumologic e Monit possono aiutarti monitorare tutto l'ambiente e i processi aziendali.
Componente | Nagios | RACCOLTE | Splunk | |
---|---|---|---|---|
Controlli a livello di sistema |
Utilizzo CPU |
|||
Memoria libera/utilizzata |
||||
Utilizzo spazio su disco |
||||
Statistiche di rete |
||||
Processi |
|
|
||
Controlli delle API |
||||
JMX |
||||
Java |
||||
File di log |
||||
Eventi critici |
Raggiungimento del limite di frequenza |
|||
Impossibile raggiungere il server di backend (Hybris o SharePoint) |
||||
Impossibile raggiungere FaaS (STS) |
||||
Eventi di avviso |
Impossibile raggiungere il server SMTP |
|||
SLA violati |