アラートのモニタリング
Apigee Edge では、次の場合にアラートを syslog や外部モニタリング システム/ツールに転送できます。 エラーや、イベントの失敗によって発生した障害。これらのアラートは、システムレベルまたは アプリケーション レベルのアラート/イベント。アプリケーション レベルのアラートは、多くの場合、発生したイベントに応じて作成されるカスタム アラートになります。通常、ネットワーク管理者はカスタム できます。アラートの詳細については、Apigee サポートにお問い合わせください。
アラートのしきい値の設定
しきい値を設定すると、そのしきい値を超えるとアラートが生成されます。設定する内容は、 構成する必要があります。また、容量に合わせてしきい値を設定する必要があります。たとえば、容量が 6 GB しかなく、Apigee Edge に対して少なすぎる場合には、次の値と等しい(=)でしきい値を割り当てることができる 条件を指定できます連続する 2 つのイベント間の時間間隔を指定することもできます。 生成できます。時/分/秒のオプションを使用できます。
システムレベル アラートの設定基準
次の表に基準を示します。
アラート | 推奨されるしきい値 | 説明 |
---|---|---|
メモリ不足 |
500 MB |
メモリが不足しているため、コンポーネントを起動できません |
ディスク容量の不足(/var/log) |
8 GB |
ディスク容量が不足しています。 |
高負荷 |
3+ |
実行を待機しているプロセスが予期せず増加しました |
プロセスを停止しました |
なし。ブール値(true または false) |
システムの Apigee Java プロセスが停止しました |
Apigee 固有のポートとサードパーティ ポートの確認
次のポートがアクティブであることを確認する
- Management Server、Router、Message Processor のポート 4526、4527、4528
- Management Server、Router、Message Processor のポート 1099、1100、1101
- Router のポート 8081、15999
- Message Processor のポート 8082、8998
- Management Server のポート 8080
次のサードパーティのポートがアクティブであることを確認します。
- Qpid ポート 5672
- Postgres ポート 5432
- Cassandra ポート 7000、7199、9042、9160
- ZooKeeper ポート 2181
- OpenLDAP ポート 10389
各 Apigee コンポーネントが API 呼び出しをリッスンしているポートを確認するには、次のコマンドを発行します。 Management Server(通常はポート 8080)に対して次の API 呼び出しを行います。
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
これらのコマンドの出力には、以下に示すようなセクションが含まれます。「
http.management.port
セクションは、指定されたコンポーネントのポート番号を提供します。
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
ログの表示
ログファイルは、システムのイベントやオペレーションに関するメッセージを追跡します。メッセージが表示されます プロセスの開始時と完了時、またはエラー状態の発生時に、ログに出力されます。ログを表示する システム コンポーネントに関する情報(CPU、メモリ、ディスク、負荷、 失敗状態になる前後に、繰り返されます。これにより 現在のシステムの問題の原因を診断したり、潜在的なシステムの 学習します
たとえば、コンポーネントの一般的なシステムログには、次のようなエントリが含まれます。
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
/opt/apigee/conf/logback.xml
ファイルを編集して、ロギング メカニズムを制御できます。
サーバーを再起動する必要はありません。logback.xml ファイルには、環境変数を設定する次のプロパティが含まれています。
ロギング メカニズムが logback.xml ファイルで構成変更をチェックする頻度:
<configuration scan="true" scanPeriod="30 seconds" >
デフォルトでは、ロギング メカニズムは 1 分ごとに変更をチェックします。時間単位を省略した場合
scanPeriod
属性の場合、デフォルトはミリ秒です。
次の表に、Apigee Edge Private Cloud コンポーネントのログファイルの場所を示します。
コンポーネント | 場所 |
---|---|
管理サーバー |
|
ルーター |
|
Message Processor |
|
Qpid サーバー |
|
Apigee Postgres サーバー |
|
Edge UI |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
PostgreSQL データベース |
|
Message Processor と Edge UI のデバッグログの有効化
Message Processor のデバッグログを有効にするには:
- Message Processor ノードで、このファイルを
/opt/apigee/customer/application/messsage-processor.properties
。このファイルで 作成します。 - このファイルに次のプロパティを追加します。
conf_system_log.level=DEBUG
- Message Processor を再起動します。
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Edge UI のデバッグログを有効にするには:
- Edge UI ノードで、
/opt/apigee/customer/application/ui.properties
を編集します。 このファイルが存在しない場合は作成します。 - このファイルに次のプロパティを追加します。
conf_application_logger.application=DEBUG
- Edge UI を再起動します。
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
apigee-monit のベスト プラクティス
apigee-monit
を使用する場合は、次のことをおすすめします。
- なんらかの操作を行う前に、コンポーネントのモニタリングを停止します 開始または停止するオペレーション(バックアップやアップグレードなど)です。
cron
などのツールを使用してapigee-monit
をモニタリングします。詳細については、apigee-monit のモニタリングをご覧ください。
モニタリング ツール
Nagios、Collectd、Graphite、Splunk、Sumologic、Monit などのモニタリング ツールが 企業の環境全体とビジネス プロセスをモニタリングできます。
コンポーネント | Nagios | 収集済み | Splunk | |
---|---|---|---|---|
システムレベルのチェック |
CPU 使用率 |
|||
空きメモリ/使用メモリ |
||||
ディスク使用量 |
||||
ネットワークの統計情報 |
||||
プロセス |
|
|
||
API チェック |
||||
JMX |
||||
Java |
||||
ログファイル |
||||
重大なイベント |
レート制限へのヒット |
|||
バックエンド サーバー(Hybris または SharePoint)にアクセスできません |
||||
FaaS(STS)に到達不能 |
||||
警告イベント |
SMTP サーバーにアクセスできません |
|||
SLA 違反 |