关于 Cassandra 复制因子和一致性级别

Cassandra 复制因子简介

Cassandra 将数据副本存储在多个节点上,以确保可靠性和容错能力。 每个 Edge 键空间的复制策略决定了放置副本的节点。

整个 Cassandra 集群中键空间的副本总数称为键空间的复制因数。复制因数为 1 表示 Cassandra 集群中每一行只有一个副本。复制因数为 2 表示每行有两个副本,其中每个副本位于不同的节点上。所有副本都同等重要;没有主副本或主副本。

在每个数据中心包含三个或更多 Cassandra 节点的生产系统中,Edge 键空间的默认复制因子为 3。一般来说,复制因子不应超过集群中的 Cassandra 节点数。

按照以下步骤查看 Cassandra 架构,该架构显示了每个 Edge 键空间的复制因子:

  1. 登录 Cassandra 节点。
  2. 运行以下命令:
    /opt/apigee/apigee-cassandra/bin/cassandra-cli -h $(hostname -i) <<< "show schema;"

    其中,$(hostname -i) 解析为 Cassandra 节点的 IP 地址。或者,您也可以将 $(hostname -i) 替换为节点的 IP 地址。

对于每个键空间,您将看到如下形式的输出:

create keyspace kms
  with placement_strategy = 'NetworkTopologyStrategy'
  and strategy_options = {dc-1 : 3}
  and durable_writes = true;

您可以看到,对于数据中心 1 (dc-1),对于具有三个 Cassandra 节点的安装,kms 键空间的默认复制系数为 3。

如果您向集群添加了其他 Cassandra 节点,则默认复制因子不受影响。

例如,如果将 Cassandra 节点的数量增加到 6 个,但将复制因子保留为 3,则无法确保所有 Cassandra 节点都具有所有数据的副本。如果某个节点出现故障,复制因子越高,表示该节点上的数据存在于其余节点上的概率越高。复制因子越高,缺点是数据写入的延迟时间增加。

Cassandra 一致性级别简介

Cassandra 一致性级别定义为在操作被视为成功之前必须确认读取或写入操作的 Cassandra 节点数下限。可以为不同的 Edge 键空间分配不同的一致性级别。

连接到 Cassandra 以进行读写操作时,消息处理器和管理服务器节点通常使用 LOCAL_QUORUM 的 Cassandra 值指定键空间的一致性级别。不过,一些键空间定义为使用一致性级别 1。

数据中心 LOCAL_QUORUM 值的计算公式如下:

LOCAL_QUORUM = (replication_factor/2) + 1

如上所述,具有三个 Cassandra 节点的 Edge 生产环境的默认复制因数为 3。因此,LOCAL_QUORUM 的默认值 = (3/2) +1 = 2(该值向下舍入为整数)。

如果 LOCAL_QUORUM = 2,则数据中心的三个 Cassandra 节点中,必须至少有两个节点必须响应读/写操作才能使操作成功。对于三节点 Cassandra 集群,集群可以容忍每个数据中心有一个节点出现故障。

通过将一致性级别指定为 LOCAL_QUORUM,Edge 可以验证多个数据中心的操作,从而避免所需的延迟。如果键空间使用 Cassandra QUORUM 值作为一致性级别,则必须在所有数据中心验证读/写操作。

要查看边缘消息处理器或管理服务器节点使用的一致性级别,请执行以下操作:

  1. 登录消息处理器节点。
  2. 切换到 /opt/apigee/edge-message-processor/conf 目录:
    cd /opt/apigee/edge-message-processor/conf
  3. 为保证写入一致性,请使用以下代码:
    grep -ri "write.consistencylevel" *
  4. 为了确保读取一致性:
    grep -ri "read.consistencylevel" *
  5. 登录 Management Server 节点。
  6. 切换到 /opt/apigee/edge-management-server/conf 目录:
    cd /opt/apigee/edge-management-server/conf
  7. 重复第 3 步和第 4 步。

如果您向集群添加其他 Cassandra 节点,则一致性级别不会受到影响。