Các phương pháp theo dõi hay nhất

Edge for Private Cloud phiên bản 4.17.01

Cảnh báo giám sát

Apigee Edge cho phép bạn chuyển tiếp cảnh báo đến nhật ký hệ thống hoặc hệ thống/công cụ giám sát bên ngoài khi xảy ra lỗi hoặc thất bại do sự kiện không thành công. Những cảnh báo này có thể là cảnh báo/sự kiện ở cấp hệ thống hoặc cấp ứng dụng. Cảnh báo cấp ứng dụng hầu hết là cảnh báo tuỳ chỉnh được tạo dựa trên các sự kiện được tạo. Quản trị viên mạng thường định cấu hình các điều kiện tuỳ chỉnh. Để biết thêm thông tin về các cảnh báo, hãy liên hệ với Nhóm hỗ trợ Apigee.

Đặt ngưỡng cảnh báo

Đặt một ngưỡng mà sau đó cảnh báo cần được tạo. Những thông số bạn thiết lập sẽ tuỳ thuộc vào cấu hình phần cứng của bạn. Bạn phải đặt ngưỡng tương ứng với hạn mức của mình. Ví dụ: Apigee có thể dung lượng quá thấp nếu bạn chỉ có dung lượng 6 GB. Bạn có thể chỉ định ngưỡng có tiêu chí bằng (=) hoặc lớn hơn (>). Bạn cũng có thể chỉ định khoảng thời gian giữa hai lần tạo cảnh báo liên tiếp. Bạn có thể sử dụng tuỳ chọn giờ/phút/giây.

Tiêu chí để đặt cảnh báo cấp hệ thống

Bảng sau đây mô tả các tiêu chí:

Cảnh báo

Ngưỡng đề xuất

Mô tả

Bộ nhớ thấp

500MB

Bộ nhớ quá thấp để khởi động một thành phần

Dung lượng ổ đĩa thấp (/var/log)

8GB

Dung lượng ổ đĩa đã giảm quá thấp.

Tải cao

3+

Các quy trình đang chờ chạy đã tăng đột ngột

Đã dừng quá trình

Không áp dụng: giá trị Boolean là true hoặc false

Quy trình Java Apigee trong hệ thống đã dừng lại

Đang kiểm tra các cổng của bên thứ ba và dành riêng cho Apigee

Hãy theo dõi các cổng sau đây để đảm bảo các cổng này đang hoạt động

  • Cổng 4526, 4527 và 4528 trên máy chủ quản lý, bộ định tuyến và bộ xử lý thư
  • Cổng 1099, 1100 và 1101 trên máy chủ quản lý, bộ định tuyến và bộ xử lý thư
  • Cổng 8081 và 15999 trên Bộ định tuyến
  • Cổng 8082 và 8998 trên Bộ xử lý thư

Cổng 8080 trên Máy chủ quản lý Kiểm tra các cổng sau đây của bên thứ ba để đảm bảo các cổng này đang hoạt động:

  • Cổng Qpid 5672
  • Cổng Postgres 5432
  • Cổng Cassandra 7000, 7199, 9042, 9160
  • Cổng ZooKeeper 2181
  • Cổng OpenLDAP 10389

Để xác định cổng mà mỗi thành phần Apigee đang theo dõi lệnh gọi API, hãy phát các lệnh gọi API sau đây tới Máy chủ quản lý (thường ở cổng 8080):

curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central&region=dc-1
curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics&region=dc-1

Kết quả của những lệnh này sẽ chứa các phần tương tự như kết quả dưới đây. Phần "http.management.port" cung cấp số cổng cho thành phần được chỉ định.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Xem nhật ký

Tệp nhật ký theo dõi các thông báo về sự kiện/hoạt động của hệ thống. Thông báo xuất hiện trong nhật ký khi các quy trình bắt đầu và hoàn tất hoặc khi một điều kiện lỗi xảy ra. Bằng cách xem tệp nhật ký, bạn có thể nắm được thông tin về các thành phần hệ thống, ví dụ: CPU, bộ nhớ, ổ đĩa, tải, quy trình, v.v. trước và sau khi đạt được trạng thái không thành công. Tính năng này cũng cho phép bạn xác định và chẩn đoán nguồn gốc của các sự cố hiện tại trong hệ thống hoặc dự đoán các sự cố có thể xảy ra với hệ thống.

Ví dụ: nhật ký hệ thống điển hình của một thành phần chứa các mục sau như sau:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;    
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Bạn có thể chỉnh sửa tệp /opt/apigee/conf/logback.xml để kiểm soát cơ chế ghi nhật ký mà không phải khởi động lại máy chủ. Tệp logback.xml chứa thuộc tính sau giúp đặt tần suất mà cơ chế ghi nhật ký sẽ kiểm tra tệp logback.xml để biết các thay đổi về cấu hình:

<configuration scan="true" scanPeriod="30 seconds" >

Theo mặc định, cơ chế ghi nhật ký sẽ kiểm tra các thay đổi mỗi phút. Nếu bạn bỏ qua đơn vị thời gian cho thuộc tính scanPeriod, giá trị mặc định sẽ là mili giây.

Bảng sau đây cho biết vị trí tệp nhật ký của các thành phần đám mây riêng tư Apigee Edge.

Thành phần

Vị trí

Máy chủ quản lý

opt/apigee/var/log/edge-management-server

Bộ định tuyến

opt/apigee/var/log/edge-router

Bộ xử lý thư

opt/apigee/var/log/edge-message-processor

Máy chủ Qpid

opt/apigee/var/log/edge-qpid-server

Máy chủ Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Giao diện người dùng Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

OpenLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Đã chuyển đổi mã nguồn (Qpidd)

opt/apigee/var/log/apigee-qpidd

Cơ sở dữ liệu PostgreSQL

opt/apigee/var/log/apigee-postgresql

Bật nhật ký gỡ lỗi cho Trình xử lý tin nhắn và Giao diện người dùng Edge

Cách bật nhật ký gỡ lỗi cho Trình xử lý thông báo:

  1. Trên nút Trình xử lý tin nhắn, hãy chỉnh sửa /opt/apigee/customer/application/messsage-processor.properties. Hãy tạo tệp nếu chưa có.
  2. Thêm thuộc tính sau vào tệp:
    conf_system_log.level=DEBUG
  3. Khởi động lại Bộ xử lý thư:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor khởi động lại

Cách bật nhật ký gỡ lỗi cho giao diện người dùng Edge:

  1. Trên nút giao diện người dùng Edge, hãy chỉnh sửa /opt/apigee/customer/application/ui.properties. Hãy tạo tệp nếu chưa có.
  2. Thêm thuộc tính sau vào tệp:
    conf_application_logger.application=DEBUG
  3. Khởi động lại giao diện người dùng Edge:
    > /opt/apigee/apigee-service/bin/apigee-service Edge-ui restart

Công cụ giám sát

Các công cụ giám sát như Nagios, Collectd, Graphite, Splunk, Sumologic và Monit có thể giúp bạn giám sát toàn bộ môi trường doanh nghiệp và quy trình kinh doanh của mình.

Thành phần

Nagios

Đã thu thập

Splunk

Kiểm tra cấp hệ thống

Mức sử dụng CPU

?

?

Bộ nhớ trống/đã sử dụng

?

?

Mức sử dụng dung lượng ổ đĩa

?

?

Số liệu thống kê mạng

?

?

Quá trình

?

Kiểm tra API

?

JMX (JMX)

?

Java

?

Tệp nhật ký

?

Sự kiện quan trọng

Lần truy cập giới hạn tốc độ

?

Không thể truy cập máy chủ phụ trợ (Hybris hoặc SharePoint)

?

Không thể truy cập FaaS (STS)

?

Sự kiện cảnh báo

Không thể truy cập máy chủ SMTP

?

SLA đã bị vi phạm

?