監控快訊
當事件失敗導致錯誤或失敗時,Apigee Edge 可將快訊轉送至 syslog 或外部監控系統/工具。這些快訊可以是系統層級或應用程式層級的快訊/事件。應用程式層級快訊大多是根據產生的事件建立的自訂快訊。網路管理員通常會設定自訂條件。如要進一步瞭解快訊,請與 Apigee 支援團隊聯絡。
設定快訊門檻
設定快訊門檻,當值超過門檻時,系統就會產生快訊。您設定的內容取決於硬體設定。請根據您的容量設定門檻。舉例來說,如果您只有 6 GB 的容量,Apigee Edge 可能會過低。您可以使用等於 (=) 或大於 (>) 的條件指派門檻。您也可以指定兩次連續產生快訊之間的時間間隔。您可以使用小時/分鐘/秒鐘選項。
設定系統層級快訊的條件
下表說明相關條件:
快訊 | 建議門檻 | 說明 |
---|---|---|
記憶體不足 |
500MB |
記憶體不足,無法啟動元件 |
磁碟空間不足 (/var/log) |
8 GB |
磁碟空間不足。 |
心肺負荷高 |
3+ |
等待執行的程序意外增加 |
已停止處理 |
不適用,布林值為 true 或 false |
系統中的 Apigee Java 程序已停止 |
檢查 Apigee 專屬和第三方連接埠
監控下列通訊埠,確保通訊埠處於活動狀態
- 管理伺服器、路由器和訊息處理器上的通訊埠 4526、4527 和 4528
- 管理伺服器、路由器和訊息處理器上的 1099、1100 和 1101 通訊埠
- 路由器上的 8081 和 15999 通訊埠
- 訊息處理工具上的通訊埠 8082 和 8998
- 管理伺服器上的 8080 通訊埠
請檢查下列第三方通訊埠,確認這些通訊埠是否處於活動狀態:
- Qpid 通訊埠 5672
- Postgres 通訊埠 5432
- Cassandra 通訊埠 7000、7199、9042、9160
- ZooKeeper 通訊埠 2181
- OpenLDAP 通訊埠 10389
如要判斷各個 Apigee 元件會在哪個通訊埠上監聽 API 呼叫,請向管理伺服器 (通常位於通訊埠 8080) 發出下列 API 呼叫:
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
這些指令的輸出內容會包含類似下方的區段。http.management.port
部分會提供指定元件的通訊埠編號。
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
查看記錄檔
記錄檔案會追蹤系統事件/作業相關訊息。在程序開始和完成時,或發生錯誤狀況時,記錄檔會顯示訊息。您可以查看記錄檔,取得系統元件的相關資訊,例如 CPU、記憶體、磁碟、負載、程序等,以便在達到失敗狀態前後進行分析。這麼做也可以讓您找出並診斷目前系統問題的來源,或預測可能發生的系統問題。
舉例來說,元件的一般系統記錄包含下列項目:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
您可以編輯 /opt/apigee/conf/logback.xml
檔案來控制記錄機制,而無須重新啟動伺服器。logback.xml 檔案包含下列屬性,可設定記錄機制檢查 logback.xml 檔案是否有設定變更的頻率:
<configuration scan="true" scanPeriod="30 seconds" >
根據預設,記錄機制會每分鐘檢查一次變更。如果您省略 scanPeriod
屬性的時間單位,系統會預設為毫秒。
下表列出 Apigee Edge Private Cloud 元件的記錄檔位置。
元件 | 位置 |
---|---|
管理伺服器 |
|
路由器 |
|
訊息處理器 |
|
Qpid 伺服器 |
|
Apigee Postgres 伺服器 |
|
Edge UI |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
PostgreSQL 資料庫 |
|
為訊息處理工具和 Edge UI 啟用偵錯記錄
如要啟用訊息處理工具的偵錯記錄功能,請按照下列步驟操作:
- 在「Message Processor」節點上編輯
/opt/apigee/customer/application/messsage-processor.properties
。如果該檔案不存在,請建立該檔案。 - 在檔案中新增下列屬性:
conf_system_log.level=DEBUG
- 重新啟動訊息處理器:
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
如要啟用 Edge UI 的偵錯記錄,請按照下列步驟操作:
- 在 Edge UI 節點中編輯
/opt/apigee/customer/application/ui.properties
。如果該檔案不存在,請建立該檔案。 - 在檔案中新增下列屬性:
conf_application_logger.application=DEBUG
- 重新啟動 Edge UI:
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
apigee-monit 最佳做法
使用 apigee-monit
時,Apigee 建議您:
- 執行任何啟動或停止元件的作業 (例如備份或升級) 前,請先停止監控元件。
- 使用
cron
等工具監控apigee-monit
。詳情請參閱「監控 apigee-monit」。
監控工具
Nagios、Collectd、Graphite、Splunk、Sumologic 和 Monit 等監控工具可協助您監控整個企業環境和業務流程。
元件 | Nagios | Collectd | Splunk | |
---|---|---|---|---|
系統層級檢查 |
CPU 使用率 |
|||
可用/已用記憶體 |
||||
磁碟空間用量 |
||||
網路統計資料 |
||||
程序 |
|
|
||
API 檢查 |
||||
JMX |
||||
Java |
||||
記錄檔 |
||||
重大事件 |
觸及頻率限制 |
|||
無法連線至後端伺服器 (Hybris 或 SharePoint) |
||||
無法連線至 FaaS (STS) |
||||
警告事件 |
無法連線至 SMTP 伺服器 |
|||
違反服務水準協議 |