Các phương pháp hay nhất để theo dõi

Cảnh báo giám sát

Apigee Edge cho phép bạn chuyển tiếp cảnh báo đến nhật ký hệ thống hoặc các hệ thống/công cụ giám sát bên ngoài khi xảy ra lỗi hoặc sự cố do sự kiện không thành công. Những cảnh báo này có thể là cảnh báo/sự kiện ở cấp hệ thống hoặc cấp ứng dụng. Thông báo ở cấp ứng dụng chủ yếu là thông báo tuỳ chỉnh được tạo dựa trên các sự kiện đã tạo. Quản trị viên mạng thường định cấu hình các điều kiện tuỳ chỉnh. Để biết thêm thông tin về cảnh báo, hãy liên hệ với Nhóm hỗ trợ Apigee.

Đặt ngưỡng cảnh báo

Đặt một ngưỡng mà sau đó cần tạo cảnh báo. Những gì bạn thiết lập phụ thuộc vào cấu hình phần cứng. Bạn nên đặt ngưỡng thanh toán dựa trên khả năng của mình. Ví dụ: Apigee Edge có thể quá thấp nếu bạn chỉ có dung lượng 6 GB. Bạn có thể chỉ định ngưỡng bằng tiêu chí bằng (=) hoặc lớn hơn (>). Bạn cũng có thể chỉ định một khoảng thời gian giữa hai lần tạo cảnh báo liên tiếp. Bạn có thể sử dụng lựa chọn giờ/phút/giây.

Tiêu chí để thiết lập cảnh báo ở cấp hệ thống

Bảng sau đây mô tả các tiêu chí:

Cảnh báo Ngưỡng đề xuất Mô tả

Bộ nhớ sắp hết

500MB

Bộ nhớ quá thấp để khởi động một thành phần

Dung lượng ổ đĩa thấp (/var/log)

8 GB

Dung lượng ổ đĩa đã giảm xuống quá thấp.

Tải cao

3+

Số lượng quy trình đang chờ chạy đã tăng đột ngột

Đã dừng xử lý

Không áp dụng, giá trị Boolean là true hoặc false

Quy trình Java của Apigee trong hệ thống đã dừng

Kiểm tra các cổng dành riêng cho Apigee và cổng của bên thứ ba

Theo dõi các cổng sau để đảm bảo chúng đang hoạt động

  • Cổng 4526, 4527 và 4528 trên Máy chủ quản lý, Bộ định tuyến và Trình xử lý thông báo
  • Cổng 1099, 1100 và 1101 trên Máy chủ quản lý, Bộ định tuyến và Trình xử lý thông báo
  • Cổng 8081 và 15999 trên Bộ định tuyến
  • Cổng 8082 và 8998 trên Bộ xử lý tin nhắn
  • Cổng 8080 trên Máy chủ quản lý

Kiểm tra các cổng của bên thứ ba sau đây để đảm bảo chúng đang hoạt động:

  • Cổng Qpid 5672
  • Cổng Postgres 5432
  • Cổng Cassandra 7000, 7199, 9042, 9160
  • Cổng ZooKeeper 2181
  • Cổng SymasLDAP 10389

Để xác định cổng mà mỗi thành phần Apigee đang theo dõi các lệnh gọi API, hãy đưa ra các lệnh gọi API sau đến Máy chủ quản lý (thường nằm trên cổng 8080):

curl -v -u username:password http://host:port/v1/servers?pod=gateway&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=central&region=dc-1
curl -v -u username:password http://host:port/v1/servers?pod=analytics&region=dc-1

Kết quả của các lệnh này sẽ chứa các phần tương tự như phần dưới đây. Phần http.management.port cho biết số cổng của thành phần được chỉ định.

{
  "externalHostName" : "localhost",
  "externalIP" : "111.222.333.444",
  "internalHostName" : "localhost",
  "internalIP" : "111.222.333.444",
  "isUp" : true,
  "pod" : "gateway",
  "reachable" : true,
  "region" : "default",
  "tags" : {
    "property" : [ {
      "name" : "Profile",
      "value" : "Router"
    }, {
      "name" : "rpc.port",
      "value" : "4527"
    }, {
      "name" : "http.management.port",
      "value" : "8081"
    }, {
      "name" : "jmx.rmi.port",
      "value" : "1100"
    } ]
  },
  "type" : [ "router" ],
  "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750"
}

Xem nhật ký

Tệp nhật ký theo dõi các thông báo liên quan đến sự kiện/hoạt động của hệ thống. Thông báo xuất hiện trong nhật ký khi các quy trình bắt đầu và hoàn tất hoặc khi xảy ra tình trạng lỗi. Bằng cách xem tệp nhật ký, bạn có thể thu thập thông tin về các thành phần hệ thống, chẳng hạn như CPU, bộ nhớ, ổ đĩa, mức tải, quy trình, v.v., trước và sau khi đạt đến trạng thái thất bại. Việc này cũng giúp bạn xác định và chẩn đoán nguồn gốc của các vấn đề hiện tại về hệ thống hoặc giúp bạn dự đoán các vấn đề tiềm ẩn về hệ thống.

Ví dụ: nhật ký hệ thống thông thường của một thành phần chứa các mục sau đây như minh hoạ bên dưới:

TimeStamp = 25/01/13 19:25 ; NextDelay = 30
Memory
HeapMemoryUsage = {used = 29086176}{max = 64880640} ;
NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ;
Threading
PeakThreadCount = 53 ; ThreadCount = 53 ;
OperatingSystem
SystemLoadAverage = 0.25 ;

Bạn có thể chỉnh sửa tệp /opt/apigee/conf/logback.xml để kiểm soát cơ chế ghi nhật ký mà không cần phải khởi động lại máy chủ. Tệp logback.xml chứa thuộc tính sau đây để đặt tần suất mà cơ chế ghi nhật ký kiểm tra tệp logback.xml để tìm các thay đổi về cấu hình:

<configuration scan="true" scanPeriod="30 seconds" >

Theo mặc định, cơ chế ghi nhật ký sẽ kiểm tra các thay đổi mỗi phút. Nếu bạn bỏ qua đơn vị thời gian cho thuộc tính scanPeriod, thì đơn vị này sẽ mặc định là mili giây.

Bảng sau đây cho biết vị trí của tệp nhật ký của các thành phần Apigee Edge Private Cloud.

Thành phần Vị trí

Máy chủ quản lý

opt/apigee/var/log/edge-management-server

Bộ định tuyến

opt/apigee/var/log/edge-router

Trình xử lý thông báo

opt/apigee/var/log/edge-message-processor

Máy chủ Qpid

opt/apigee/var/log/edge-qpid-server

Máy chủ Apigee Postgres

opt/apigee/var/log/edge-postgres-server

Giao diện người dùng Edge

opt/apigee/var/log/edge-ui

ZooKeeper

opt/apigee/var/log/apigee-zookeeper

SymasLDAP

opt/apigee/var/log/apigee-openldap

Cassandra

opt/apigee/var/log/apigee-cassandra

Qpidd

opt/apigee/var/log/apigee-qpidd

Cơ sở dữ liệu PostgreSQL

opt/apigee/var/log/apigee-postgresql

Bật nhật ký gỡ lỗi cho Trình xử lý tin nhắn và Giao diện người dùng Edge

Cách bật nhật ký gỡ lỗi cho Trình xử lý tin nhắn:

  1. Trên nút Message Processor (Bộ xử lý thông báo), hãy chỉnh sửa /opt/apigee/customer/application/message-processor.properties. Nếu tệp đó không tồn tại, hãy tạo tệp.
  2. Thêm thuộc tính sau vào tệp:
    conf_system_log.level=DEBUG
  3. Khởi động lại Trình xử lý tin nhắn:
    /opt/apigee/apigee-service/bin/apigee-service edge-message-processor restart

Cách bật nhật ký gỡ lỗi cho giao diện người dùng Edge:

  1. Trên nút giao diện người dùng Edge, hãy chỉnh sửa /opt/apigee/customer/application/ui.properties. Nếu tệp đó không tồn tại, hãy tạo tệp.
  2. Thêm thuộc tính sau vào tệp:
    conf_application_logger.application=DEBUG
  3. Khởi động lại giao diện người dùng Edge:
    /opt/apigee/apigee-service/bin/apigee-service edge-ui restart

Các phương pháp hay nhất về apigee-monit

Khi sử dụng apigee-monit, Apigee khuyên bạn nên:

  • Dừng giám sát một thành phần trước khi bạn thực hiện bất kỳ thao tác nào khởi động hoặc dừng thành phần đó, chẳng hạn như sao lưu hoặc nâng cấp.
  • Theo dõi apigee-monit bằng cách sử dụng một công cụ như cron. Để biết thêm thông tin, hãy xem bài viết Theo dõi apigee-monit.

Công cụ giám sát

Các công cụ giám sát như Nagios, Collectd, Graphite, Splunk, Sumologic và Monit có thể giúp bạn giám sát toàn bộ môi trường doanh nghiệp và quy trình kinh doanh của mình.

Thành phần Nagios Collectd Splunk

Kiểm tra ở cấp hệ thống

Mức sử dụng CPU

Bộ nhớ trống/đã dùng

Mức sử dụng dung lượng ổ đĩa

Số liệu thống kê mạng

Quá trình

Kiểm tra API

JMX

Java

Tệp nhật ký

Sự kiện quan trọng

Đạt đến giới hạn số lần yêu cầu

Không thể kết nối với máy chủ phụ trợ (Hybris hoặc SharePoint)

Không thể truy cập vào FaaS (STS)

Sự kiện cảnh báo

Không thể kết nối với máy chủ SMTP

Vi phạm SLA