Nhiệm vụ bảo trì Apache Cassandra

Phần này mô tả các tác vụ bảo trì định kỳ cho Cassandra.

Bảo trì chống entropy

Các nút vòng Apache Cassandra cần được bảo trì định kỳ để đảm bảo tính nhất quán trên tất cả các nút. Để thực hiện việc bảo trì này, hãy sử dụng lệnh sau:

apigee-service apigee-cassandra apigee_repair -pr

Apigee đề xuất những điều sau đây khi chạy lệnh này:

  • Chạy trên mọi nút Cassandra (trên tất cả các khu vực hoặc trung tâm dữ liệu).
  • Chạy trên một nút tại một thời điểm để đảm bảo tính nhất quán trên tất cả các nút trong vòng. Việc chạy các công việc sửa chữa trên nhiều nút cùng một lúc có thể ảnh hưởng đến trạng thái của Cassandra.

    Để kiểm tra xem một công việc sửa chữa trên một nút đã hoàn tất thành công hay chưa, hãy tìm trong tệp system.log của các nút để tìm một mục có UUID của phiên sửa chữa mới nhất và cụm từ "phiên đã hoàn tất thành công". Dưới đây là mục nhập nhật ký mẫu:

    INFO [AntiEntropySessions:1] 2015-03-01 10:02:56,245 RepairSession.java (line 282) [repair #2e7009b0-c03d-11e4-9012-99a64119c9d8] session completed successfully"
    Ref: https://support.datastax.com/hc/en-us/articles/204226329-How-to-check-if-a-scheduled-nodetool-repair-ran-successfully
  • Chạy trong những khoảng thời gian có khối lượng công việc tương đối thấp (công cụ này gây ra tải đáng kể cho hệ thống).
  • Chạy ít nhất 7 ngày một lần để loại bỏ các vấn đề liên quan đến "lỗi xoá bị quên" của Cassandra.
  • Chạy trên các nút khác nhau vào các ngày khác nhau hoặc lên lịch để có vài giờ giữa các lần chạy trên mỗi nút.
  • Sử dụng tuỳ chọn -pr (phạm vi trình phân vùng) để chỉ định phạm vi trình phân vùng chính của nút.

Nếu đã bật tính năng xác thực JMX cho Cassandra, bạn phải thêm tên người dùng và mật khẩu khi gọi nodetool. Ví dụ:

apigee-service apigee-cassandra apigee_repair -u username -pw password -pr

Bạn cũng có thể chạy lệnh sau để kiểm tra các tuỳ chọn được hỗ trợ của apigee_repair:

apigee-service apigee-cassandra apigee_repair -h

Lưu ý: apigee_repair là một trình bao bọc xung quanh tính năng sửa chữa nodetool của Cassandra, thực hiện các bước kiểm tra bổ sung trước khi thực hiện tính năng sửa chữa của Cassandra.

Để biết thêm thông tin, hãy xem các tài nguyên sau:

Bảo trì tệp nhật ký

Nhật ký Cassandra được lưu trữ trong thư mục /opt/apigee/var/log/apigee-cassandra trên mỗi nút. Theo mặc định, bạn có thể tạo tối đa 50 tệp nhật ký, mỗi tệp có kích thước tối đa là 20 MB; khi đạt đến giới hạn này, các nhật ký cũ sẽ bị xoá khi các nhật ký mới được tạo.

Nếu nhận thấy các tệp nhật ký Cassandra đang chiếm quá nhiều dung lượng, bạn có thể sửa đổi dung lượng được phân bổ cho các tệp nhật ký bằng cách chỉnh sửa chế độ cài đặt log4j.

  1. Chỉnh sửa /opt/apigee/customer/application/cassandra.properties để đặt các thuộc tính sau. Nếu tệp đó không tồn tại, hãy tạo tệp:
    conf_logback_maxfilesize=20MB
    # max file size
    conf_logback_maxbackupindex=50 # max open files
  2. Khởi động lại Cassandra bằng lệnh sau:
    /opt/apigee/apigee-service/bin/apigee-service apigee-cassandra restart

Bảo trì dung lượng ổ đĩa

Bạn nên thường xuyên theo dõi mức sử dụng ổ đĩa Cassandra để đảm bảo ít nhất 50% dung lượng của mỗi ổ đĩa là trống. Nếu mức sử dụng ổ đĩa tăng lên trên 50%, bạn nên tăng dung lượng ổ đĩa để giảm tỷ lệ phần trăm đang sử dụng.

Cassandra tự động thực hiện các thao tác sau để giảm mức sử dụng ổ đĩa của chính nó:

  • Xoá mã thông báo xác thực khi mã thông báo hết hạn. Tuy nhiên, có thể mất vài tuần để giải phóng dung lượng ổ đĩa mà mã thông báo đang sử dụng, tuỳ thuộc vào cấu hình của bạn. Nếu tính năng xoá tự động không đủ để duy trì dung lượng ổ đĩa, hãy liên hệ với nhóm hỗ trợ để tìm hiểu cách xoá mã thông báo theo cách thủ công nhằm khôi phục dung lượng.
  • Lưu ý về việc nén dữ liệu: Kể từ Edge for Private Cloud 4.51.00, các lượt cài đặt mới của Apigee Cassandra sẽ tạo không gian khoá bằng chiến lược nén theo cấp.

    Các lượt cài đặt phiên bản cũ của Edge for Private Cloud đã được nâng cấp lên Private Cloud 4.51.00 sẽ tiếp tục giữ nguyên chiến lược nén trước đó. Nếu chiến lược nén hiện tại là SizeTieredCompactionStrategy, bạn nên thay đổi thành LeveledCompactionStrategy để sử dụng ổ đĩa hiệu quả hơn.

Lưu ý: Khi Cassandra thực hiện việc nén dữ liệu, quá trình này có thể tốn một lượng đáng kể chu kỳ CPU và bộ nhớ. Tuy nhiên, mức sử dụng tài nguyên sẽ trở lại bình thường sau khi quá trình nén hoàn tất. Bạn có thể chạy lệnh 'Nodetool compactionstats' trên mỗi nút để kiểm tra xem tính năng nén có đang chạy hay không. Kết quả của compactionstats sẽ cho bạn biết liệu có quá trình nén đang chờ xử lý hay không và thời gian ước tính để hoàn tất.