Informazioni sul fattore di replica e sul livello di coerenza di Cassandra

Informazioni sul fattore di replica Cassandra

Cassandra archivia le repliche dei dati su più nodi per garantire affidabilità e tolleranza di errore. La strategia di replica per ogni spazio delle chiavi Edge determina i nodi in cui vengono posizionate le repliche.

Il numero totale di repliche per uno spazio delle chiavi in un cluster Cassandra è definito fattore di replica dello spazio delle chiavi. Un fattore di replica pari a uno indica che esiste una sola copia di ogni riga nel cluster Cassandra. Un fattore di replica pari a due indica che esistono due copie di ogni riga e ogni copia si trova su un nodo diverso. Tutte le repliche sono ugualmente importanti. Non esiste una replica principale o master.

In un sistema di produzione con tre o più nodi Cassandra in ciascun data center, il fattore di replica predefinito per uno spazio delle chiavi Edge è tre. Come regola generale, il fattore di replica non deve superare il numero di nodi Cassandra nel cluster.

Utilizza la seguente procedura per visualizzare lo schema Cassandra, che mostra il fattore di replica per ogni spazio delle chiavi Edge:

  1. Accedi a un nodo Cassandra.
  2. Esegui questo comando:
    /opt/apigee/apigee-cassandra/bin/cqlsh $(hostname -i) [-u cassuser -p casspass] -e "select keyspace_name, replication from system_schema.keyspaces;"

    Dove $(hostname -i) si risolve nell'indirizzo IP del nodo Cassandra. In alternativa, puoi sostituire $(hostname -i) con l'indirizzo IP del nodo.

    cassuser: se hai attivato l'autenticazione Cassandra, passa il nome utente Cassandra. Questa operazione è facoltativa e può essere saltata se non hai abilitato l'autenticazione Cassandra.

    casspass: se hai attivato l'autenticazione Cassandra, passa la password di Cassandra. Questa operazione è facoltativa e può essere saltata se non hai abilitato l'autenticazione Cassandra.

Verrà visualizzato un output come quello riportato di seguito, in cui ogni riga rappresenta uno spazio delle chiavi:

  keyspace_name       | replication                                                                 
  kms                 | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'}
  system_distributed  | {'class': 'org.apache.cassandra.locator.SimpleStrategy', 'replication_factor': '3'}
  apprepo             | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'}
  

Puoi notare che per il data center 1, dc-1, il fattore di replica predefinito per lo spazio delle chiavi kms è tre per un'installazione con tre nodi Cassandra. Per alcuni spazi delle chiavi interni a Cassandra (come system, system_schema e così via), la strategia di replica e il fattore di replica potrebbero essere diversi. Si tratta di un comportamento intenzionale del sistema.

Se aggiungi altri nodi Cassandra al cluster, il fattore di replica predefinito non è interessato.

Informazioni sul livello di coerenza di Cassandra

Il livello di coerenza Cassandra è definito come il numero minimo di nodi Cassandra che devono confermare un'operazione di lettura o scrittura prima che l'operazione possa essere considerata riuscita. È possibile assegnare diversi livelli di coerenza a spazi dei tasti di Edge diversi.

Durante la connessione a Cassandra per le operazioni di lettura e scrittura, i nodi del processore di messaggi e del server di gestione in genere utilizzano il valore Cassandra di LOCAL_QUORUM per specificare il livello di coerenza per uno spazio delle chiavi. Tuttavia, alcuni spazi delle chiavi sono definiti in modo da utilizzare un livello di coerenza pari a 1.

Il calcolo del valore di LOCAL_QUORUM per un data center è:

LOCAL_QUORUM = (replication_factor/2) + 1

Come descritto in precedenza, il fattore di replica predefinito per un ambiente di produzione Edge con tre nodi Cassandra è tre. Di conseguenza, il valore predefinito di LOCAL_QUORUM = (3/2) +1 = 2 (il valore viene arrotondato per difetto a un numero intero).

Con LOCAL_QUORUM = 2, almeno due dei tre nodi Cassandra nel data center devono rispondere a un'operazione di lettura/scrittura affinché l'operazione venga completata. Per un cluster Cassandra a tre nodi, il cluster potrebbe quindi tollerare lo stato inattivo di un nodo per data center.

Specificando il livello di coerenza come LOCAL_QUORUM, Edge evita la latenza richiesta convalidando le operazioni in più data center. Se uno spazio delle chiavi utilizzasse il valore QUORUM di Cassandra come livello di coerenza, le operazioni di lettura/scrittura dovrebbero essere convalidate in tutti i data center.

Per visualizzare il livello di coerenza utilizzato dai nodi del processore di messaggi Edge o del server di gestione:

  1. Accedi a un nodo del processore di messaggi.
  2. Passa alla directory /opt/apigee/edge-message-processor/conf:
    cd /opt/apigee/edge-message-processor/conf
  3. Per coerenza in lettura e scrittura:
    grep -ri "consistency.level" *
  4. Accedi al nodo del server di gestione.
  5. Passa alla directory /opt/apigee/edge-management-server/conf:
    cd /opt/apigee/edge-management-server/conf
  6. Ripeti il passaggio 3.

Se aggiungi altri nodi Cassandra al cluster, il livello di coerenza non viene influenzato.