Ceph: il Linux dello storage

Novembre 7, 2022
Ceph il futuro dello storage

Ricercando costantemente negli anni soluzioni innovative, un pò per curiosità, un pò per gioco ed un pò per esigenze professionali ci siamo imbattuti nel progetto Ceph.

Inizialmente parlare di Software Defined Storage sembrava la solita soluzione fantascientifica di fronte a colossi dello storage quali EMC2, IBM, NetApp, Oracle e simili, senza contare le infinite convention e meeting di popolari aziende software ed hardware che denigravano sempre le soluzioni open source (ma ogg sappiamo come sta andando..).

Questo successe quando decidemmo di utilizzare Linux come sistema operativo per le aziende all'inizio degli anni 2000, per poi seguire lo stesso trend con la virtualizzazione grazie a Kvm (alternativa open a VMware e Xen di Citrix).

Oggi possiamo dire che Linux è il sistema operativo più utilizzato al mondo nell'ambito della produzione enterprise e Kvm un hypervisor molto apprezzato [fonte 1, 2].

E molto probabilmente questo avverrà anche per Ceph in ambito storage.

Indice:

  1. Lo storage fino a qualche tempo fa
  2. Possiamo dire che Ceph è il Linux dello storage?
  3. Il vantaggio di essere “software defined”
  4. Ceph apre la strada a nuove figure professionali e a nuove soluzioni

Lo storage fino a qualche tempo fa

La verità è che un buon prodotto open source nasce dalla massa, dalla necessità di inventare e cambiare radicalmente il mondo (solo software?), gettando nelle fauci affamate dei nerd delle iperboliche novità, dando loro la possibilità di scrivere del buon codice.

Poi alcuni progetti si concretizzano e necessitano di avere un supporto professionale.

Ora tralasciando prodotti o veri e propri brand che già hanno segnato la strada (Linux, Red Hat, Kvm, Suse, Mariadb, Apache, etc) mi focalizzerei su una rivoluzione che è in atto e sta cambiando radicalmente il concetto di storage o meglio di archiviazione dei dati.

Negli anni in cui stiamo vivendo siamo circondati da informazioni, segnali elettrici ed impulsi elettromagnetici che ci incasellano, tracciano, controllano ed aiutano quotidianamente.

Avere dati è sinonimo di potere, e di questo forse adesso se ne stanno accorgendo un pò tutti.

  • Ma questa mole di dati dove viene archiviata?
  • Per quanto tempo?
  • Come è possibile avere una rappresentazione digitale per intero della nostra vita?
  • Siamo consapevoli che ogni microsecondo può essere registrato e archiviato per sempre?

Quell'apparato che si utilizza per memorizzare i dati è definito imperativamente con una parola inglese: “storage".

Fino a qualche anno fa questo “storage” era per lo più una parola che troneggiava nelle infrastrutture enterprise, e ci si avvicinava ad esso con un certo sentimento di meraviglia, timore e rispetto.

Lo storage era un argomento serio solo per gli eletti del mondo business enterprise, principalmente per gli annessi costi e le operazioni di manutenzione ad alta professionalità necessarie, concetti che oggi stridono con gli investimenti che impongono, vista l’obsolescenza rapidissima delle soluzioni odierne di archiviazione dei dati.

Questo impero, da tanti considerato intoccabile fino a ieri, oggi non lo è più, si è fatto strada un movimento dal basso, un prodotto open source che può essere il game changer in questo regno: il suo nome è Ceph.

Possiamo dire che Ceph è il Linux dello storage?

Ceph viene definito il Linux dello storage, cerchiamo di capire il perché con un esempio.

Nessuno oggi pensa a quale sistema operativo Unix-like usare, perché quello open source è il migliore, quindi tutti lo usano di default e si tratta di Linux.

Anche e probabilmente proprio grazie a questa diffusione Linux è in continuo miglioramento.

Bene, Ceph si sta muovendo nello stesso modo nel mondo dello Storage.

Inizialmente risultava un prodotto di nicchia, relegato a grandi ambiti di virtualizzazione (Openstack e simili).

Successivamente a seguito della continua necessità di spazio di archiviazione e alle

  • economicità
  • scalabilità
  • affidabilità
  • persistenza

e altre funzionalità richieste insistentemente il mondo IT ha capito che si deve guardare alle soluzioni Software Defined Storage.

E il re indiscusso di questo ambito è risultato Ceph, motivo per il quale oggi molte aziende contribuiscono allo sviluppo del prodotto ed alla sua manutenzione.

Ne è prova il fatto che anche IBM ha comunicato in data 09.10.2022 che il prodotto Red Hat Ceph Storage Enterprise diverrà IBM cloud Storage [fonte: 1].

 

Il vantaggio di essere “software defined”

Seguendo da anni lo sviluppo di Ceph abbiamo notato l'ingresso nel mondo "Linux dello Storage" di aziende come Nvidia, GoDaddy, Canonical, SUSE, IBM e sopratutto alla nascita della Ceph Foundation.

Questo come naturale evoluzione di un progetto assolutamente fondamentale e necessario.

Ceph è open source ed è software defined, è studiato per funzionare su hardware commodity, ovvero su hardware da riutilizzare indipendentemente che sia nuovo o di un particolare brand, che sia affidabile o meno, indipendentemente anche dal brand del network e da come sono interconnessi tra loro i vari elementi, perché è completamente software defined.

Ovviamente questa libertà di scelta ed indipendenza, classiche caratteristiche nel mondo open source, si traducono in una certa complessità di gestione del sistema.

L'approccio non convenzionale allo storage fa si che vi siano nuovi concetti da affrontare e che funzioni fuori dagli schemi tradizionali, quindi è fondamentale avere le skills ed i tecnici giusti per mettere in funzione Ceph.

Questo aspetto può in prima battuta intimorire, ma del resto quello che vale oggi più che mai sono la conoscenza, le skills e la disponibilità ad interoperare tra aziende e persone.

Sicuramente rispetto ad una soluzione "boxata" richiede uno sforzo economico che si sposta sulla progettazione ed assistenza (o supporto), ma ne vale di gran lunga la pena.

Ceph apre la strada a nuove figure professionali e a nuove soluzioni

Ceph a nostro parere apre un mercato nuovo, dove si creeranno degli specialisti per la gestione dei dati distribuiti su larga scala, così come si creeranno prodotti nuovi che appoggiano le loro basi proprio su Ceph.

Il poter utilizzare uno Storage Software Defined elimina i lock-in dei vendor di hardware prettamente dediti allo storage, permette la realizzazione di sistemi di storage clusterizzati sia in ambito fisico che virtuale ed anche on-demand in modo automatico (Kubernetes).

Inoltre l'open source permette di implementare sopra a Ceph (Software Defined Storage) tutti i protocolli di accesso ai dati che sono normalmente utilizzati: SMB, NFS, RBD, ISCSI, CephFS, S3, Swift.

Così facendo questi protocolli ereditano la scalabilità, ridondanza, affidabilità, auto riparazione, distribuzione e replica che Ceph intrinsecamente prevede e che magari non erano previsti all'implementazione dello specifico protocollo.

Anche l'avvento dei container e di Kubernetes ha accelerato queste richieste.

L'utilizzo di ambienti a micro servizi richiede comunque la gestione di uno storage persistente, che può essere attivato e disattivato a piacimento, modificato nella forma e dimensione senza l'intervento manuale.

Ceph si integra in modo perfetto in questi ambienti.

L'industria dei datacenter sta sperimentando un’esplosione delle richieste di capacità in termini di spazio, consumi, affidabilità e ridondanza da parte di molti mercati emergenti.

Settori come il 5G, l’IoT, l'intelligenza artificiale, il machine learning, cold storage oppure edge computing stanno versando benzina sul fuoco già acceso dalla necessità di exabyte di spazio disponibili per salvare dati.

La notizia è che Ceph è già pronto! E voi?

ITServicenet vi supporta per la consulenza, progettazione e manutenzione della soluzione Ceph.

Ing. Alessandro Bolgia - Linkedin

Altri articoli su Ceph:

Ceph e il DR per tutte le tasche

Ceph Octopus, note di una evoluzione

ITServicenet = Kubernetes + Ceph + Nextcloud

Ceph la via flessibile

Ceph per lo storage software defined

© 2022 All rights reserved