Tu sei qui

Architetture a Cluster

Cluster ad alta disponibilità

I Cluster HA (High Availability) possono essere in configurazione attiva/attiva o attiva/passiva, a seconda del servizio che devono garantire. Lo scopo di questa architettura è di garantire una più alta disponibilità e affidabilità del sistema rispetto ai server tradizionali.
L'adozione di questa architettura permette di ridurre la complessità dell'hardware, pur offrendo una ridondanza completa invece che limitata ad alcuni componenti.
Si tratta di un sistema composto da due server Linux, identici dal punto di vista hardware e software, in cui però i servizi realmente attivi sono suddivisi tra le due macchine.
Tra le due macchine è attivo un sistema che monitorizza costantemente lo stato dei servizi su entrambi i nodi. In condizioni normali, ognuna delle due macchine esegue i propri servizi, ma in caso di caduta di uno dei server, il sistema provvede a lanciare tutti i servizi inattivi sull'altra macchina, assumendone anche il nome e l'IP, in modo che entrambi i nodi siano sempre visti come un unico nodo dall'esterno.
In entrambe le macchine è installato il servizio Heartbeat (battito del cuore). Questo comunica tra le due macchine tramite due sottoreti dedicate, una connessione ethernet e una connessione seriale, per verificare lo stato di salute dell'altro nodo del cluster e prevenire la condizione di split brain.
La split brain syndrome si verifica quando tutte le reti designate per le comunicazioni interne si arrestano e i nodi non possono ricevere i segnali heartbeat. La split brain syndrome viene evitata richiedendo sempre la disponibilità e l'interazione della maggioranza dei due nodi e della funzione di condivisione di file affinché il server cassette postali di cluster sia operativo.
La condizione di split brain si presenta quando tutte le comunicazioni interne si arrestano ma i due nodi continuano a funzionare regolarmente. In questo caso ogni nodo potrebbe pensare che il nodo fratello sia "morto" e decidere erroneamente di assumere il suo carico di lavoro, portando ad una duplicazione di esecuzione dei servizi e quindi a un'inconsistenza e corruzione dei dati.

Questa deprecabile condizione viene prevenuta da componenti software che controllano in modo remoto la tensione elettrica dell'altro nodo e, usando un'interruttore di rete, possono forzarne lo spegnimento.

L'interruttore di rete rileva la condizione di split brain.