ceph stretch cluster il lavoro continua

Ceph Stretch Cluster

Proxmox backup server 4, la nuova versione della soluzione open source per il backup introduce il supporto nativo allo storage S3.

Continuità operativa garantita su due datacenter — anche in caso di guasto totale di un sito

Quando l’infrastruttura non può fermarsi

Cos’è uno Stretch Cluster, in parole semplici

I punti di forza: perché sceglierlo

Quando l’infrastruttura non può fermarsi

Immaginate un’azienda con due sedi operative, magari a pochi chilometri di distanza. In ognuna di esse risiedono server, applicazioni critiche, dati sensibili. Un giorno — per un guasto elettrico, un incendio, un errore umano — uno dei due siti smette di rispondere. Cosa accade ai dati? Alle applicazioni in esecuzione? Agli utenti che in quel momento stanno lavorando?

Se l’infrastruttura è progettata con Ceph in modalità Stretch Cluster, la risposta è semplice: non accade nulla. Il sistema continua a funzionare esattamente come prima, in modo trasparente, senza intervento manuale. Questa non è magia: è architettura.

Cos’è uno Stretch Cluster, in parole semplici

Ceph è una piattaforma di storage distribuito open source, progettata per replicare e gestire i dati su più nodi fisici eliminando qualsiasi singolo punto di guasto. La modalità Stretch Cluster spinge questo concetto oltre i confini di un singolo rack o di un singolo edificio: i dati vengono distribuiti in modo sincrono su due datacenter geograficamente separati, con un terzo nodo — detto arbiter o tiebreaker — che funge da arbitro neutrale in caso di disaccordo tra i due siti.

Il risultato pratico è un sistema che tollera la perdita completa di un intero datacenter senza interrompere il servizio, senza perdita di dati e — nella maggior parte dei casi — senza che gli utenti finali si accorgano di nulla.

I punti di forza: perché sceglierlo

Il primo e più evidente vantaggio è la continuità operativa garantita by design. Non si tratta di un backup da ripristinare o di un piano di disaster recovery da attivare in emergenza: lo Stretch Cluster è già in produzione, sempre, su entrambi i siti. Il failover è automatico e immediato.

A questo si affianca la coerenza dei dati: ogni scrittura è confermata solo quando viene registrata su entrambi i siti. Non esiste il rischio di lavorare su dati obsoleti o di dover riconciliare copie divergenti dopo un incidente.

Dal punto di vista economico, poi, la soluzione risulta molto più accessibile rispetto alle alternative enterprise proprietarie con funzionalità equivalenti. Ceph è open source, funziona su hardware commodity standard e non richiede licenze per nodo o per terabyte. Questo si traduce in una scalabilità orizzontale sostanzialmente illimitata, con costi prevedibili e lineari.

Infine, lo Stretch Cluster supporta tutte le modalità di accesso tipiche di Ceph: storage a blocchi (RBD), object storage (S3-compatibile via RGW) e filesystem distribuito (CephFS). Una singola piattaforma copre le esigenze di database, macchine virtuali, backup e applicazioni cloud-native.

Le criticità da non sottovalutare

Sarebbe disonesto parlare di questa soluzione senza citarne i limiti. Il primo riguarda la latenza di rete: poiché ogni scrittura deve essere confermata da entrambi i siti prima di essere considerata completata, un collegamento lento o instabile tra i datacenter si traduce direttamente in degrado delle prestazioni. La regola generale suggerisce di non superare i 10 ms di latenza RTT tra i siti, un vincolo che limita la distanza geografica massima tra di essi.

La complessità operativa è un altro aspetto da considerare con serietà. Ceph in modalità standard richiede già competenze specifiche; lo Stretch Cluster aggiunge un livello di sofisticazione ulteriore nella configurazione delle regole CRUSH, nella gestione del nodo arbiter e nel monitoraggio della replica tra siti. Non è una soluzione per chi parte da zero senza il giusto supporto.

Va anche considerato che alcune funzionalità avanzate di Ceph — come le regole di placement differenziate per device class — risultano incompatibili o limitate in modalità stretched, richiedendo valutazioni architetturali preventive per non trovarsi con vincoli inaspettati in produzione.

Per chi ha senso investire in questa soluzione?

Lo Stretch Cluster è la scelta giusta per organizzazioni che hanno due sedi fisiche (o due datacenter) con una connettività affidabile e a bassa latenza tra di esse, e che non possono permettersi downtime né perdita di dati: ambienti sanitari, enti pubblici, aziende manifatturiere con sistemi ERP critici, provider di servizi IT, realtà che gestiscono dati finanziari o documentali di valore elevato.

Se l’obiettivo è costruire un’infrastruttura che sopravviva a qualunque scenario — e che lo faccia in modo autonomo, trasparente e senza dipendere da vendor proprietari — Ceph Stretch Cluster è oggi una delle risposte più solide che il mondo open source possa offrire.

Emanuele Bajardo

ITServicenet open source supportato

SUBSCRIBE TO THE NEWSLETTER

Would you like to receive updates from ItServiceNet?