監控最佳做法

監控警告

如果事件失敗而導致錯誤或故障,Apigee Edge 可將快訊轉送至系統記錄或外部監控系統/工具。這些快訊可以是系統層級或應用程式層級的快訊/事件。應用程式層級快訊大多是根據產生的事件建立的自訂快訊。網路管理員通常會設定自訂條件。如要進一步瞭解快訊,請與 Apigee 支援團隊聯絡。

設定快訊門檻

設定門檻,超過門檻時系統會產生快訊。設定內容取決於硬體設定。門檻應根據容量設定。舉例來說,如果容量只有 6 GB,Apigee Edge 可能會過低。您可以指派等於 (=) 或大於 (>) 條件的門檻。您也可以指定連續產生兩則快訊之間的時間間隔。你可以使用「時/分/秒」選項。

設定系統層級快訊的條件

下表說明相關條件:

快訊 建議門檻 說明

記憶體不足

500MB

記憶體不足,無法啟動元件

磁碟空間不足 (/var/log)

8 GB

磁碟空間不足。

高負載

3+

等待執行的程序意外增加

程序已停止

不適用,布林值為 true 或 false

系統中的 Apigee Java 程序已停止

檢查 Apigee 專用和第三方連接埠

監控下列通訊埠,確保通訊埠處於啟用狀態

  • 管理伺服器、路由器和訊息處理器上的通訊埠 4526、4527 和 4528
  • 管理伺服器、路由器和訊息處理器上的通訊埠 1099、1100 和 1101
  • 路由器上的通訊埠 8081 和 15999
  • 訊息處理工具上的通訊埠 8082 和 8998
  • 管理伺服器上的通訊埠 8080

請檢查下列第三方通訊埠是否處於啟用狀態:

  • Qpid 通訊埠 5672
  • Postgres 連接埠 5432
  • Cassandra 通訊埠 7000、7199、9042、9160
  • ZooKeeper 通訊埠 2181
  • SymasLDAP 通訊埠 10389

如要判斷每個 Apigee 元件監聽 API 呼叫的通訊埠,請對管理伺服器 (通常位於通訊埠 8080) 發出下列 API 呼叫:

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

這些指令的輸出內容會包含類似下方的區段。「http.management.port」部分會提供指定元件的通訊埠編號。

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

查看記錄

記錄檔會追蹤系統事件/作業的相關訊息。程序開始和完成時,或發生錯誤狀況時,記錄檔中會顯示訊息。查看記錄檔可取得系統元件的相關資訊,例如 CPU、記憶體、磁碟、負載、程序等,瞭解達到失敗狀態前後的狀況。您也可以藉此找出並診斷目前系統問題的來源,或預測潛在的系統問題。

舉例來說,元件的典型系統記錄包含下列項目,如下所示:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

您可以編輯 /opt/apigee/conf/logback.xml 檔案來控管記錄機制,不必重新啟動伺服器。logback.xml 檔案包含下列屬性,可設定記錄機制檢查 logback.xml 檔案的頻率,以瞭解設定變更:

<configuration scan="true" scanPeriod="30 seconds" >

根據預設,記錄機制每分鐘都會檢查變更。如果省略 scanPeriod 屬性的時間單位,系統會預設為毫秒。

下表說明 Apigee Edge Private Cloud 元件的記錄檔位置。

元件 位置

管理伺服器

opt/apigee/var/log/edge-management-server

路由器

opt/apigee/var/log/edge-router

訊息處理器

opt/apigee/var/log/edge-message-processor

Qpid 伺服器

opt/apigee/var/log/edge-qpid-server

Apigee Postgres 伺服器

opt/apigee/var/log/edge-postgres-server

Edge UI

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

SymasLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

PostgreSQL 資料庫

opt/apigee/var/log/apigee-postgresql

啟用訊息處理工具和 Edge UI 的偵錯記錄

如要啟用訊息處理工具的偵錯記錄,請按照下列步驟操作:

  1. 在 Message Processor 節點上,編輯 /opt/apigee/customer/application/message-processor.properties。如果該檔案不存在,請建立檔案。
  2. 在檔案中新增下列屬性:
    conf_system_log.level=DEBUG
  3. 重新啟動 Message Processor:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

如要啟用 Edge UI 的偵錯記錄,請按照下列步驟操作:

  1. 在 Edge UI 節點上,編輯 /opt/apigee/customer/application/ui.properties。 如果該檔案不存在,請建立檔案。
  2. 在檔案中新增下列屬性:
    conf_application_logger.application=DEBUG
  3. 重新啟動 Edge UI:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

apigee-monit 最佳做法

使用 apigee-monit 時,Apigee 建議您:

  • 執行任何啟動或停止元件的作業 (例如備份或升級) 前,請先停止監控元件
  • 使用 cron 等工具監控 apigee-monit。詳情請參閱「監控 apigee-monit」。

監控工具

您可以使用 Nagios、Collectd、Graphite、Splunk、Sumologic 和 Monit 等監控工具,監控整個企業環境和業務程序。

元件 Nagios Collectd Splunk

系統層級檢查

CPU 使用率

可用/已用記憶體

磁碟空間用量

網路統計資料

程序

API 檢查

JMX

Java

記錄檔

重大事件

達到頻率限制

無法連線至後端伺服器 (Hybris 或 SharePoint)

無法連線至 FaaS (STS)

警告事件

無法連線至 SMTP 伺服器

違反服務水準協議