Cassandra のレプリケーション係数と整合性レベルについて

Cassandra のレプリケーション係数について

Cassandra は、信頼性とフォールト トレランスを確保するため、複数のノードにデータレプリカを保持します。レプリカが配置されるノードは、Edge キースペースごとのレプリケーション戦略によって決まります。

あるキースペースの、Cassandra クラスタ全体でのレプリカの合計数のことを、そのキースペースの「レプリケーション係数」と呼びます。レプリケーション係数が 1 の場合は、Cassandra クラスタに各行のコピーが 1 つだけ存在することを意味します。レプリケーション係数が 2 の場合は、各行のコピーが 2 つあり、各コピーが異なるノードに存在することを意味します。すべてのレプリカは同等の重要性を持ちます。プライマリ レプリカやマスター レプリカは存在しません。

データセンターごとに 3 つ以上の Cassandra ノードがある本番環境システムでは、Edge キースペースのデフォルトのレプリケーション係数は 3 です。一般的なルールとして、レプリケーション係数はクラスタ内の Cassandra ノードの数を超えることはできません。

Edge キースペースごとのレプリケーション係数を示す Cassandra スキーマを表示するには、次の手順に従います。

  1. Cassandra ノードにログインします。
  2. 次のコマンドを実行します。
    /opt/apigee/apigee-cassandra/bin/cassandra-cli -h $(hostname -i) <<< "show schema;"

    ここで、$(hostname -i) は Cassandra ノードの IP アドレスに解決されます。$(hostname -i) の代わりにノードの IP アドレスを指定することもできます。

キースペースごとに、次の形式で結果が出力されます。

    create keyspace kms
      with placement_strategy = 'NetworkTopologyStrategy'
      and strategy_options = {dc-1 : 3}
      and durable_writes = true;
    

この出力から、データセンター 1(dc-1)の kms キースペースのデフォルトのレプリケーション係数は 3(3 つの Cassandra ノードを持つインストール構成に対応する数)であることがわかります。

Cassandra ノードをクラスタに追加しても、デフォルトのレプリケーション係数は影響を受けません。

たとえば、Cassandra ノードの数を 6 に増やしたとしても、レプリケーション係数が 3 のままであれば、すべての Cassandra ノードにすべてのデータのコピーが存在するとは限りません。レプリケーション係数を大きくすれば、ノードがダウンした場合に、そのノードのデータが残りのノードのいずれかに存在する確率は高くなります。ただし、レプリケーション係数を大きくすると、データの書き込みによりレイテンシが増加するというデメリットがあります。

Cassandra の整合性レベルについて

Cassandra の整合性レベルは、「読み取りまたは書き込みオペレーションが成功とみなされるために、そのオペレーションに対して肯定応答を返さなければならない最小の Cassandra ノードの数」と定義されています。Edge キースペースごとに異なる整合性レベルを割り当てることができます。

読み取り / 書き込みオペレーションのために Cassandra に接続するとき、Message Processor ノードと Management Server ノードは通常、Cassandra の LOCAL_QUORUM 値を使用してキースペースの整合性レベルを指定します。ただし、一部のキースペースは整合性レベル 1 を使用するように定義されています。

データセンターの LOCAL_QUORUM の値の計算式は次のとおりです。

LOCAL_QUORUM = (replication_factor/2) + 1

前述のとおり、3 つの Cassandra ノードを持つ Edge 本番環境のデフォルトのレプリケーション係数は 3 です。したがって、LOCAL_QUORUM のデフォルト値は (3/2) +1 = 2 になります(小数点以下は切り捨てられます)。

LOCAL_QUORUM = 2 の場合、読み取り / 書き込みオペレーションが成功とみなされるためには、データセンター内の 3 つの Cassandra ノードのうち少なくとも 2 つがそのオペレーションに応答する必要があります。したがって、3 つのノードを持つ Cassandra クラスタでは、データセンターごとに 1 つのノードがダウンすることを許容できます。

Edge は、整合性レベルを LOCAL_QUORUM として指定することにより、複数のデータセンターにわたってオペレーションを検証することから生じるレイテンシを回避しています。キースペースが Cassandra の QUORUM 値を整合性レベルとして使用していれば、すべてのデータセンターにわたって読み取り / 書き込みオペレーションを検証しなければなりません。

Edge の Message Processor ノードまたは Management Server ノードで使用される整合性レベルを確認するには:

  1. Message Processor ノードにログインします。
  2. /opt/apigee/edge-message-processor/conf ディレクトリに移動します。
    cd /opt/apigee/edge-message-processor/conf
  3. 書き込み整合性については次のコマンドを実行します。
    grep -ri "write.consistencylevel" *
  4. 読み取り整合性については次のコマンドを実行します。
    grep -ri "read.consistencylevel" *
  5. Management Server ノードにログインします。
  6. /opt/apigee/edge-management-server/conf ディレクトリに移動します。
    cd /opt/apigee/edge-management-server/conf
  7. ステップ 3 と 4 を繰り返します。

Cassandra ノードをクラスタに追加しても、整合性レベルは影響を受けません。