Cartea „Lebăda Neagră” scrisă de Nassim Nicholas Taleb explorează conceptul de evenimente rare, puternic improbabile, dar cu un impact enorm asupra lumii noastre. Deloc surprinzător această filosofie poate fi aplicată și în lumea tehnologiei și a soluțiilor IT de tip data center sau cybersecurity. În acest articol vom explora modul în care se traduce conceptul de Lebădă Neagră în domeniul IT și cum putem gestiona riscul într-o lume atât de dinamică aflată într-o continuă schimbare.
de Alexandru Trifu, Hypercubic IT Solutions
Ce este o Lebădă Neagră în IT?
În domeniul IT, o Lebădă Neagră reprezintă un eveniment rar, dar cu impact major, care poate afecta negativ, parțial sau iremediabil, operațiunile unui data-center sau ale unui sistem informatic care deservește o activitate de business, responsabilitatea în cazul unui furnizor fiind una dublă. Un eveniment rar poate fi reprezentat de un incident de securitate cibernetică, un defect critic a unui echipament cheie, un cutremur, o inundație sau alte catastrofe naturale. De asemenea, poate fi o inovație sau o descoperire surprinzătoare care revoluționează complet modul în care lucrurile sunt făcute în industria IT.
Gestionarea riscului în data center
Gestionarea riscului se traduce prin minimizarea pierderilor și prin asigurarea continuității, iar acest lucru se poate realiza doar prin construirea unui ecosistem IT, strategiile care trebuiesc aplicate fiind următoarelele:
I. Redundanță:
Implementarea redundanței în infrastructură poate ajuta la minimizarea impactului unor eșecuri majore și constă în: echipamente duplicate, surse de alimentare și conexiuni de internet dublate, acesta fiind un prim avantaj și poate cel mai important al externalizării acestor tipuri de servicii către o companie specilizată.
Un sistem de clasificare al unui data-center este o modalitate de a evalua și a defini nivelul de disponibilitate, redundanță și calitate a serviciilor oferite de către acel data-center. Acest sistem de clasificare ajută utilizatorii să înțeleagă cât de fiabil și robust este data-centerul în furnizarea serviciilor și să facă comparații între diferite facilități. Unul dintre cele mai cunoscute sisteme de clasificare este standardul TIER dezvoltat de Uptime Institute. Iată o scurtă descriere a sistemului de clasificare TIER pentru data-center:
Standardul TIER al Uptime Institute:
TIER I: Un data center de nivelul I are o arhitectură simplă, fără redundanță. Oricare dintre componentele critice, cum ar fi alimentarea cu energie sau răcirea, nu are un backup complet. Prin urmare, data-centerul nu poate asigura disponibilitatea 24/7.
TIER II: Un data center de nivelul II adaugă o anumită redundanță în componentele critice, cum ar fi alimentarea, dar în general, operațiunile pentru mentenanță planificată necesită încă oprirea serviciilor. Acest nivel poate asigura disponibilitate 99,741% (aproximativ 22 de ore de nefuncționare pe an).
TIER III: Data centerul de nivelul III are o arhitectură de bază cu redundanță în toate componentele critice. Aceasta include două surse independente de alimentare și răcire, permițând mentenanță planificată fără oprirea serviciilor. Acest nivel poate asigura disponibilitate 99,982% (aproximativ 1,6 ore de nefuncționare pe an).
TIER IV: Data centerul de nivelul IV oferă cea mai mare disponibilitate și fiabilitate. Are redundanță completă și componente dublate în toate aspectele. Poate suporta mentenanță planificată sau chiar eșecul unei componente fără a afecta disponibilitatea serviciilor. Acest nivel poate asigura disponibilitatea 99,995% (aproximativ 26,3 minute de nefuncționare pe an).
II. Planuri de backup și recuperare:
Crearea unor planuri de backup și recuperare bine definite și testate regulat poate ajuta la recuperarea rapidă a datelor și serviciilor în cazul unui incident neașteptat. Asigură-te că ai destul spațiu alocat pentru a stoca cel puțin 3 versiuni ale datelor cu caracter critic.
Iată care sunt principalele forme de back-up:
Backup complet: Acest tip de backup implică copierea tuturor datelor critice într-un mediu de stocare separat. Backup-ul complet este util pentru a asigura o restaurare rapidă a datelor în cazul unui eșec major, dar poate ocupa o cantitate semnificativă de spațiu de stocare.
Backup incremental: Backup-ul incremental copiază numai datele noi sau modificate de la ultimul backup, reducând timpul necesar pentru efectuarea backup-ului și spațiul de stocare necesar. Restaurarea datelor poate fi mai lentă, deoarece sunt necesare mai multe iterații de backup pentru a readuce sistemul la starea dorită.
Backup diferențial: Asemănător cu backup-ul incremental, însă copiază numai datele modificate de la ultimul backup complet. Acest tip de backup poate fi mai rapid în timpul restaurării decât backup-ul incremental, dar necesită mai mult spațiu de stocare.
Backup la nivel de fișiere: Acest tip de backup copiază fișierele individuale care sunt considerate critice pentru organizație. Este util atunci când trebuie să se recupereze doar anumite fișiere și nu întregul sistem.
Backup la nivel de imagine: Acest tip de backup creează o imagine completă a sistemului sau a unei părți a acestuia, inclusiv sistemul de operare, aplicațiile și datele. Acesta permite o restaurare rapidă a întregului sistem în caz de eșec major.
Backup la nivel de masina virtuala: Pentru organizatiile care ruleaza masini virtuale, acest tip de backup copiaza intreaga masina virtuala, inclusiv toate componentele sale. Permite o restaurare rapida si usoara a intregii masini virtuale.
Backup off-site: Backup-ul off-site implica stocarea copiilor de siguranta intr-un loc fizic separat fata de locatia sursa. Aceasta ofera protectie impotriva dezastrelor naturale sau a altor evenimente care ar putea afecta centrul de date principal.
Backup in cloud: Backup-ul in cloud implica stocarea copiilor de siguranta pe servere de stocare cloud. Acesta ofera accesibilitate si redundanta, fiind o solutie populara pentru multe organizatii.
III. Prevenție – monitorizare și analiză constantă:
Utilizarea sistemelor de monitorizare avansate și a analizei predictive poate ajuta la identificarea potențialelor probleme înainte să devină catastrofale. NU te baza doar pe monitorizarea standard care să-ți confirme doar ceea ce vrei să vezi, ci apelează constant la un audit IT extern care să-ți dea o perspectivă obiectivă a nivelului de securitate.
IV. Flexibilitate și adaptabilitate:
Construirea unui data-center modular și scalabil poate permite adaptarea rapidă la schimbările din mediul IT și minimizarea riscului de a rămâne blocat în tehnologii invechite. NU vă transformați experiența în prejudecată.
Inovare și oportunități din Lebăda Neagră
Pe lângă riscuri, conceptul de Lebăda Neagră poate aduce și oportunități neașteptate și inovație în domeniul IT. Descoperiri neașteptate și tehnologii revoluționare pot schimba radical paradigmele de lucru și pot oferi avantaje semnificative.
Învățarea din evenimentele Lebedei Negre anterioare
Un aspect important în gestionarea riscului în data-center este învățarea din evenimentele Lebedei Negre anterioare. Analizarea atentă a incidentelor din trecut și a modului în care au fost abordate poate furniza învățăminte valoroase pentru îmbunătățirea proceselor și a măsurilor de protecție.
În concluzie, cartea Lebăda Neagră a lui Nassim Taleb ne învață că, în lumea tehnologiei și a soluțiilor IT pentru data center, trebuie să fim conștienți de existența evenimentelor puternic improbabile, dar cu un impact uriaș. Prin gestionarea adecvată a riscului și prin adoptarea unei atitudini de adaptabilitate și inovare, putem să ne protejăm infrastructura IT și să transformăm aceste provocări în oportunități de creștere și dezvoltare. Dacă ești în căutare de soluții data center, contactează-ne aici.