Apache Cassandra 維護工作

本節說明 Cassandra 的定期維護工作。

反熵維護

Apache Cassandra 環節點需要定期維護,以確保所有節點的一致性。如要執行這項維護作業,請使用下列指令:

apigee-service apigee-cassandra apigee_repair -pr

Apigee 建議在執行這個指令時執行下列動作:

  • 在每個 Cassandra 節點上執行 (在所有區域或資料中心)。
  • 一次在一個節點上執行,以確保環環中所有節點的一致性。 同時在多個節點上執行修復工作可能會降低 Cassandra 的健康狀態。

    如要檢查節點上的修復工作是否順利完成,請查看節點的 system.log 檔案,找出含有最新修復工作階段 UUID 和「工作階段已成功完成」的詞組。以下是記錄項目範例:

    INFO [AntiEntropySessions:1] 2015-03-01 10:02:56,245 RepairSession.java (line 282) [repair #2e7009b0-c03d-11e4-9012-99a64119c9d8] session completed successfully"
    Ref: https://support.datastax.com/hc/en-us/articles/204226329-How-to-check-if-a-scheduled-nodetool-repair-ran-successfully
  • 在工作負載相對較低的期間執行 (這項工具會對系統造成大量負載)。
  • 請至少每七天執行一次,才能排除與 Cassandra 的「忘記刪除」相關的問題。
  • 在不同節點上執行不同的節點,或是將其排程使每個節點在幾小時之間執行。
  • 使用 -pr 選項 (分區器範圍) 可以僅指定節點的主要分區器範圍。

如果您為 Cassandra 啟用 JMX 驗證,則必須在叫用 nodetool 時提供使用者名稱和密碼。例如:

apigee-service apigee-cassandra apigee_repair -u username -pw password -pr

您也可以執行下列指令,查看 apigee_repair: 的支援選項

apigee-service apigee-cassandra apigee_repair -h

附註: apigee_repair 是 Cassandra 節點工具修復的包裝函式,在執行 Cassandra 修復前執行額外檢查。

詳情請參閱下列資源:

維護記錄檔

Cassandra 記錄檔會儲存在每個節點的 /opt/apigee/var/log/cassandra 目錄中。預設情況下,您可以建立最多 50 個記錄檔,每個檔案的大小上限為 20 MB。一旦達到這個上限,建立新的記錄就會刪除。

如果您發現 Cassandra 記錄檔佔用過多空間,您可以編輯 log4j 設定,修改分配給記錄檔的空間容量。

  1. 編輯 /opt/apigee/customer/application/cassandra.properties 即可設定下列屬性。如果該檔案不存在,請建立檔案:
    conf_logback_maxfilesize=20MB
    # max file size
    conf_logback_maxbackupindex=50 # max open files
  2. 使用下列指令重新啟動 Cassandra:
    /opt/apigee/apigee-service/bin/apigee-service apigee-cassandra restart

磁碟空間維護

建議您定期監控 Cassandra 磁碟的使用率,確保每個磁碟至少有 50% 的可用空間。如果磁碟使用率超過 50%,建議您新增更多磁碟空間,以降低正在使用的百分比。

Cassandra 會自動執行以下作業來降低磁碟使用率:

  • 權杖過期時,系統會刪除驗證權杖。不過,視您的設定而定,系統可能需要數週才能釋出權杖使用的磁碟空間。如果自動刪除功能不足以維持足夠的磁碟空間,請與支援團隊聯絡,瞭解如何手動刪除權杖來釋出空間。
  • 資料壓縮。建議您將鍵空間的壓縮策略變更為 LeveledCompactionStrategy,這可以提供比預設的 SizeTieredCompactionStrategy 更好的磁碟使用率策略。請參閱「 分級密集策略」。

注意:Cassandra 執行資料壓縮時,可能會需要大量的 CPU 週期和記憶體。不過,在完成壓縮後,資源使用率應會恢復正常。您可以在每個節點上執行 'Nodetool compactionstats' 指令,檢查壓縮是否正在執行。compactionstats 的輸出內容會指出是否有待處理的壓縮,以及預計完成的時間。