모니터링 알림
Apigee Edge를 사용하면 이벤트 실패로 인해 오류나 실패가 발생할 때 syslog 또는 외부 모니터링 시스템/도구로 알림을 전달할 수 있습니다. 이러한 알림은 시스템 수준 또는 애플리케이션 수준 알림/이벤트일 수 있습니다. 애플리케이션 수준 알림은 대부분 생성된 이벤트를 기반으로 생성된 맞춤 알림입니다. 일반적으로 네트워크 관리자가 맞춤 조건을 구성합니다. 알림에 관한 자세한 내용은 Apigee 지원팀에 문의하세요.
알림 기준 설정
알림을 생성해야 하는 기준점을 설정합니다. 설정하는 값은 하드웨어 구성에 따라 다릅니다. 기준점은 용량과 관련하여 설정해야 합니다. 예를 들어 용량이 6GB인 경우 Apigee Edge가 너무 낮을 수 있습니다. 같음 (=) 또는 크거나 같음 (>) 기준으로 기준점을 할당할 수 있습니다. 두 번 연속 경보 생성 간의 시간 간격을 지정할 수도 있습니다. 시간/분/초 옵션을 사용할 수 있습니다.
시스템 수준 알림 설정 기준
다음 표에는 기준이 설명되어 있습니다.
알림 | 추천 기준 | 설명 |
---|---|---|
메모리 부족 |
500MB |
메모리가 부족하여 구성요소를 시작할 수 없음 |
디스크 공간 부족 (/var/log) |
8GB |
디스크 공간이 너무 부족합니다. |
높은 부하 |
3회 이상 |
실행을 기다리는 프로세스가 예기치 않게 증가함 |
프로세스 중지됨 |
해당 사항 없음, 불리언 값(true 또는 false) |
시스템의 Apigee Java 프로세스가 중지됨 |
Apigee 관련 및 서드 파티 포트 확인
다음 포트가 활성 상태인지 모니터링합니다.
- 관리 서버, 라우터, 메시지 프로세서의 포트 4526, 4527, 4528
- 관리 서버, 라우터, 메시지 프로세서의 포트 1099, 1100, 1101
- 라우터의 포트 8081 및 15999
- 메시지 프로세서의 포트 8082 및 8998
- 관리 서버의 포트 8080
다음 서드 파티 포트가 활성 상태인지 확인합니다.
- Qpid 포트 5672
- Postgres 포트 5432
- Cassandra 포트 7000, 7199, 9042, 9160
- ZooKeeper 포트 2181
- OpenLDAP 포트 10389
각 Apigee 구성요소가 API 호출을 수신 대기하는 포트를 확인하려면 관리 서버 (일반적으로 포트 8080에 있음)에 다음 API 호출을 실행합니다.
curl -v -u username:password http://host:port/v1/servers?pod=gateway®ion=dc-1curl -v -u username:password http://host:port/v1/servers?pod=central®ion=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics®ion=dc-1
이 명령어의 출력에는 아래와 유사한 섹션이 포함됩니다. http.management.port
섹션은 지정된 구성요소의 포트 번호를 제공합니다.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
로그 보기
로그 파일은 시스템의 이벤트/작업과 관련된 메시지를 추적합니다. 메시지는 프로세스가 시작되고 완료될 때 또는 오류 조건이 발생할 때 로그에 표시됩니다. 로그 파일을 확인하면 실패 상태가 되기 전과 후의 CPU, 메모리, 디스크, 부하, 프로세스 등 시스템 구성요소에 관한 정보를 얻을 수 있습니다. 또한 이를 통해 현재 시스템 문제의 원인을 파악하고 진단하거나 잠재적인 시스템 문제를 예측할 수 있습니다.
예를 들어 구성요소의 일반적인 시스템 로그에는 다음과 같은 항목이 포함됩니다.
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
/opt/apigee/conf/logback.xml
파일을 수정하여 서버를 다시 시작하지 않고도 로깅 메커니즘을 제어할 수 있습니다. logback.xml 파일에는 로깅 메커니즘이 logback.xml 파일에서 구성 변경사항을 확인하는 빈도를 설정하는 다음 속성이 포함되어 있습니다.
<configuration scan="true" scanPeriod="30 seconds" >
기본적으로 로깅 메커니즘은 1분마다 변경사항을 확인합니다. scanPeriod
속성의 시간 단위를 생략하면 기본적으로 밀리초로 설정됩니다.
다음 표에는 Apigee Edge Private Cloud 구성요소의 로그 파일 위치가 나와 있습니다.
구성요소 | 위치 |
---|---|
관리 서버 |
|
라우터 |
|
메시지 프로세서 |
|
Qpid 서버 |
|
Apigee Postgres Server |
|
Edge UI |
|
ZooKeeper |
|
OpenLDAP |
|
Cassandra |
|
Qpidd |
|
PostgreSQL 데이터베이스 |
|
메시지 프로세서 및 Edge UI의 디버그 로그 사용 설정
메시지 프로세서의 디버그 로그를 사용 설정하려면 다음 단계를 따르세요.
- 메시지 프로세서 노드에서
/opt/apigee/customer/application/messsage-processor.properties
를 수정합니다. 이 파일이 없으면 만듭니다. - 파일에 다음 속성을 추가합니다.
conf_system_log.level=DEBUG
- 메시지 프로세서를 다시 시작합니다.
/opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart
Edge UI의 디버그 로그를 사용 설정하려면 다음 단계를 따르세요.
- Edge UI 노드에서
/opt/apigee/customer/application/ui.properties
를 수정합니다. 이 파일이 없으면 만듭니다. - 파일에 다음 속성을 추가합니다.
conf_application_logger.application=DEBUG
- Edge UI를 다시 시작합니다.
/opt/apigee/apigee-service/bin/apigee-service edge-ui restart
apigee-monit 권장사항
apigee-monit
를 사용할 때는 다음을 따르는 것이 좋습니다.
- 백업이나 업그레이드와 같이 구성요소를 시작하거나 중지하는 작업을 실행하기 전에 구성요소 모니터링을 중지합니다.
cron
과 같은 도구를 사용하여apigee-monit
를 모니터링합니다. 자세한 내용은 apigee-monit 모니터링을 참고하세요.
모니터링 도구
Nagios, Collectd, Graphite, Splunk, Sumologic, Monit와 같은 모니터링 도구를 사용하면 전체 엔터프라이즈 환경과 비즈니스 프로세스를 모니터링할 수 있습니다.
구성요소 | Nagios | Collectd | Splunk | |
---|---|---|---|---|
시스템 수준 검사 |
CPU 사용률 |
|||
사용 가능한 메모리/사용된 메모리 |
||||
디스크 공간 사용량 |
||||
네트워크 통계 |
||||
프로세스 |
|
|
||
API 검사 |
||||
JMX |
||||
자바 |
||||
로그 파일 |
||||
심각한 이벤트 |
비율 제한 발생 |
|||
백엔드 서버 (Hybris 또는 SharePoint)에 연결할 수 없음 |
||||
FaaS (STS)에 연결할 수 없음 |
||||
경고 이벤트 |
SMTP 서버에 연결할 수 없음 |
|||
SLA 위반 |