Edge cho Private Cloud phiên bản 4.17.05
Cảnh báo giám sát
Apigee Edge cho phép bạn chuyển tiếp cảnh báo đến nhật ký hệ thống hoặc công cụ/hệ thống giám sát bên ngoài khi lỗi hoặc lỗi xảy ra do lỗi của một sự kiện. Những cảnh báo này có thể là cảnh báo cấp hệ thống hoặc thông báo/sự kiện ở cấp ứng dụng. Cảnh báo ở cấp ứng dụng chủ yếu là cảnh báo tuỳ chỉnh được tạo dựa trên các sự kiện được tạo. Quản trị viên mạng thường định cấu hình dịch vụ . Để biết thêm thông tin về cảnh báo, hãy liên hệ với Nhóm hỗ trợ của Apigee.
Đặt ngưỡng cảnh báo
Đặt ngưỡng mà sau đó cảnh báo cần được tạo. Những gì bạn đặt phụ thuộc vào cấu hình phần cứng. Bạn phải đặt ngưỡng tương ứng với hạn mức của mình. Ví dụ: Apigee Edge có thể quá thấp nếu bạn chỉ có dung lượng 6 GB. Bạn có thể chỉ định ngưỡng bằng (=) hoặc lớn hơn tiêu chí (>). Bạn cũng có thể chỉ định khoảng thời gian giữa hai lần liên tiếp tạo cảnh báo. Bạn có thể sử dụng tuỳ chọn giờ/phút/giây.
Tiêu chí để đặt cảnh báo ở cấp hệ thống
Bảng sau đây mô tả các tiêu chí:
Cảnh báo |
Ngưỡng đề xuất |
Nội dung mô tả |
---|---|---|
Sắp hết bộ nhớ |
500MB |
Bộ nhớ quá thấp nên không thể khởi động một thành phần |
Dung lượng ổ đĩa thấp (/var/log) |
8GB |
Dung lượng ổ đĩa đã giảm quá thấp. |
Tải trọng cao |
3+ |
Số quy trình đang chờ chạy đã tăng đột ngột |
Đã dừng quá trình |
N/A, giá trị Boolean là true hoặc false |
Quy trình Java của Apigee trong hệ thống đã dừng |
Đang kiểm tra thông tin dành riêng cho Apigee và của bên thứ ba Cổng
Hãy giám sát các cổng sau để đảm bảo chúng đang hoạt động
- Cổng 4526, 4527 và 4528 trên Máy chủ quản lý, Bộ định tuyến và Bộ xử lý thư
- Cổng 1099, 1100 và 1101 trên Máy chủ Quản lý, Bộ định tuyến và Bộ xử lý Thư
- Cổng 8081 và 15999 trên bộ định tuyến
- Cổng 8082 và 8998 trên bộ xử lý tin nhắn
Cổng 8080 trên Máy chủ quản lý Hãy kiểm tra các cổng bên thứ ba sau đây để đảm bảo chúng đang hoạt động:
- Cổng Qpid 5672
- Cổng Postgres 5432
- Cổng Cassandra 7000, 7199, 9042, 9160
- Cổng ZooKeeper 2181
- Cổng OpenLDAP 10389
Để xác định cổng mà mỗi thành phần Apigee đang nghe lệnh gọi API đang bật, vấn đề các lệnh gọi API sau đến Máy chủ quản lý (thường trên cổng 8080):
curl -v -u <username>:<password> http://<host>:<port>/v1/servers?pod=gateway®ion=dc-1 curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=central®ion=dc-1 curl -v -u <username>:<password> http:// <host>:<port>/v1/servers?pod=analytics®ion=dc-1
Kết quả của các lệnh này sẽ chứa các phần tương tự như trình bày dưới đây. Chiến lược phát hành đĩa đơn "http.management.port" mục cung cấp số cổng cho thành phần được chỉ định.
{ "externalHostName" : "localhost", "externalIP" : "111.222.333.444", "internalHostName" : "localhost", "internalIP" : "111.222.333.444", "isUp" : true, "pod" : "gateway", "reachable" : true, "region" : "default", "tags" : { "property" : [ { "name" : "Profile", "value" : "Router" }, { "name" : "rpc.port", "value" : "4527" }, { "name" : "http.management.port", "value" : "8081" }, { "name" : "jmx.rmi.port", "value" : "1100" } ] }, "type" : [ "router" ], "uUID" : "2d4ec885-e20a-4173-ae87-10be38b35750" }
Xem nhật ký
Tệp nhật ký theo dõi các thông báo về sự kiện/hoạt động của hệ thống. Tin nhắn xuất hiện trong nhật ký khi quá trình bắt đầu và hoàn tất hoặc khi xảy ra tình trạng lỗi. Bằng cách xem nhật ký tệp, bạn có thể lấy thông tin về các thành phần của hệ thống, ví dụ: CPU, bộ nhớ, ổ đĩa, tải, quy trình, v.v. trước và sau khi đạt trạng thái không thành công. Điều này cũng giúp bạn xác định và chẩn đoán nguồn gốc của các sự cố hiện tại với hệ thống hoặc giúp bạn dự đoán nguyên nhân có thể xảy ra với hệ thống vấn đề.
Ví dụ: nhật ký hệ thống thông thường của một thành phần chứa các mục sau như dưới đây:
TimeStamp = 25/01/13 19:25 ; NextDelay = 30 Memory HeapMemoryUsage = {used = 29086176}{max = 64880640} ; NonHeapMemoryUsage = {init = 24313856}{committed = 57278464} ; Threading PeakThreadCount = 53 ; ThreadCount = 53 ; OperatingSystem SystemLoadAverage = 0.25 ;
Bạn có thể chỉnh sửa tệp /opt/apigee/conf/logback.xml để kiểm soát cơ chế ghi nhật ký mà không cần phải khởi động lại máy chủ. Tệp logback.xml chứa thuộc tính sau đây sẽ đặt giá trị tần suất mà cơ chế ghi nhật ký kiểm tra tệp logback.xml cho các thay đổi về cấu hình:
<configuration scan="true" scanPeriod="30 seconds" >
Theo mặc định, cơ chế ghi nhật ký sẽ kiểm tra các thay đổi mỗi phút. Nếu bạn bỏ qua đơn vị thời gian vào thuộc tính scanPeriod, mặc định là mili giây.
Bảng sau đây cho biết vị trí của tệp nhật ký của các thành phần trên đám mây riêng tư của Apigee Edge.
Thành phần |
Vị trí |
---|---|
Máy chủ quản lý |
opt/apigee/var/log/edge-management-server |
Bộ định tuyến |
opt/apigee/var/log/edge-router |
Trình xử lý tin nhắn |
opt/apigee/var/log/edge-message-processor |
Máy chủ Qpid |
opt/apigee/var/log/edge-qpid-server |
Máy chủ Apigee Postgres |
opt/apigee/var/log/edge-postgres-server |
Giao diện người dùng Edge |
opt/apigee/var/log/edge-ui |
ZooKeeper |
opt/apigee/var/log/apigee-zookeeper |
OpenLDAP |
opt/apigee/var/log/apigee-openldap |
Cassandra |
opt/apigee/var/log/apigee-cassandra |
Qpidd |
opt/apigee/var/log/apigee-qpidd |
Cơ sở dữ liệu PostgreSQL |
opt/apigee/var/log/apigee-postgresql |
Bật nhật ký gỡ lỗi cho Thông báo Giao diện người dùng của bộ xử lý và Edge
Cách bật nhật ký gỡ lỗi cho Trình xử lý thông báo:
- Trên nút Trình xử lý thư, hãy chỉnh sửa /opt/apigee/customer/application/messsage-processor.properties. Nếu tệp đó không tồn tại, hãy tạo tệp.
- Thêm thuộc tính sau vào tệp:
conf_system_log.level=DEBUG - Khởi động lại Trình xử lý thư:
> /opt/apigee/apigee-service/bin/apigee-service Edge-message-processor khởi động lại
Cách bật nhật ký gỡ lỗi cho giao diện người dùng Edge:
- Trên nút Giao diện người dùng Edge, hãy chỉnh sửa /opt/apigee/customer/application/ui.properties. Nếu tệp đó không tồn tại, hãy tạo tệp.
- Thêm thuộc tính sau vào tệp:
conf_application_logger.application=DEBUG - Khởi động lại giao diện người dùng Edge:
> /opt/apigee/apigee-service/bin/apigee-service cạnh-ui khởi động lại
Công cụ giám sát
Các công cụ giám sát như Nagios, Collectd, Graphite, Splunk, Sumologic và Monit có thể giúp bạn giám sát toàn bộ môi trường doanh nghiệp và các quy trình kinh doanh.
Thành phần |
Nagios |
Đã thu thập |
Splunk |
|
---|---|---|---|---|
Kiểm tra cấp hệ thống |
Sử dụng CPU |
? |
? |
|
Bộ nhớ còn trống/đã dùng |
? |
? |
||
Mức sử dụng dung lượng ổ đĩa |
? |
? |
||
Số liệu thống kê mạng |
? |
? |
||
Quá trình |
? |
|||
Kiểm tra API |
? |
|||
JMX |
? |
|||
Java |
? |
|||
Tệp nhật ký |
? |
|||
Sự kiện quan trọng |
Đã đạt đến Giới hạn số lần yêu cầu |
? |
||
Không thể truy cập máy chủ phụ trợ (Hybris hoặc POS) |
? |
|||
Không thể truy cập FaaS (STS) |
? |
|||
Sự kiện cảnh báo |
Không thể kết nối với máy chủ SMTP |
? |
||
Đã vi phạm SLA |
? |