A afla dacă sistemele de rezervă și recuperare funcționează bine este mai complicat decât să știi cât de eficiente sunt copiile de rezervă și restaurările, iar acordul asupra unui set de valori esențiale este cheia pentru a judeca corect un sistem de acest tip.
O primă logică esențială este legată de faptul că sistemul de rezervă are suficientă capacitate de stocare pentru a vă satisface nevoile actuale și viitoare de backup și recuperare. Indiferent despre ce tip de stocare discutăm, sistemul de stocare are o capacitate limitată și trebuie monitorizat permanent care este aceasta și ce procent se utilizează de-a lungul timpului.
Utilizarea serviciilor bazate pe cloud poate ajuta la ușurarea acestei griji, deoarece unele servicii oferă o cantitate esențial nelimitată de capacitate. Fiecare sistem de stocare are capacitatea de a accepta un anumit volum de copii de rezervă pe zi, de obicei măsurate în megabite pe secundă sau terabyte pe oră. Ar trebui să fiți conștienți de acest număr și să vă asigurați că monitorizați utilizarea sistemului de backup al acestuia. Nerespectarea acestui lucru poate duce la o copie de rezervă mai lungă sau mai scurtă care poate duce ori la o utilizare excesivă de resurse ori la o copie insuficientă sau incompletă.
Monitorizarea capacității de transfer și a utilizării lățimii de bandă este deosebit de importantă. Este foarte important ca transferul copiilor de rezervă să se potrivească cu capacitatea de a transfera date. Mai exact, debitul furnizat trebuie să fie mai mare decât viteza minimă a unității de bandă. Astfel, este necesară documentația pentru unitate și sistemul de asistență al furnizorului pentru a afla care este viteza minimă acceptabilă pentru ca utilizatorul să se apropie cât mai bine de ea. Este puțin probabil să vă apropiați de viteza maximă a unității cu bandă, dar ar trebui monitorizată oricum și aceasta.
Capacitatea sistemului de rezervă este determinată și de capacitatea sistemului de calcul din spatele acestuia. În cazul în care capacitatea de procesare a serverelor de rezervă sau a bazei de date din spatele sistemului de rezervă nu este în măsură să țină pasul, acesta poate încetini, de asemenea, copiile de rezervă și va duce la ineficiența lor în ziua de muncă. De asemenea, ar trebui să monitorizați performanța sistemului de rezervă pentru a vedea gradul în care se întâmplă acest lucru.
Cele două valori anterioare sunt foarte importante, deoarece acestea afectează ceea ce numim fereastra de rezervă: perioada de timp în care backup-urile pot fi rulate. Dacă utilizați un sistem de backup tradițional unde există un impact semnificativ asupra performanței sistemelor primare în timpul copierii, ar trebui să decideți în prealabil care este fereastra de rezervă. Dacă vă apropiați de completarea întregii ferestre, este timpul să reevaluați fereastra sau să reproiectați sistemul de backup.
Companiile care folosesc tehnici de backup care se încadrează în categoria incrementală, cu backup-uri incrementale la nivel de bloc sau copii de rezervă pentru deduplicare sursă, nu trebuie să se preocupe în mod obișnuit de o fereastră de rezervă. Acest lucru se datorează faptului că copiile de rezervă rulează pentru perioade foarte scurte de timp și transferă o cantitate mică de date, un proces care are, de obicei, un impact de performanță foarte scăzut asupra sistemelor primare. Acesta este motivul pentru care clienții care utilizează astfel de sisteme efectuează de obicei backup-uri pe parcursul zilei, de multe ori o dată pe oră sau chiar la fiecare cinci minute. Un adevărat sistem CDP rulează de fapt continuu, transferând fiecare nou octet așa cum este scris.
Nimănui nu-i pasă cu adevărat de cât timp durează să fie realizată o copie de rezervă, mai important fiind cât durează restabilirea. Obiectivul timpului de recuperare (RTO) este intervalul de timp convenit de toate părțile în care ar trebui să se realizeze o restaurare după unincident. Durata unui RTO acceptabil pentru orice companie este determinată în mod obișnuit de suma de bani pe care o va pierde la căderea sistemelor. De exemplu, dacă o companie va pierde milioane de dolari pe oră în timpul perioadei de oprire, în mod obișnuit, aceasta dorește un RTO foarte strâns. Companiile, cum ar fi firmele de tranzacționare financiară, încearcă, de exemplu, să aibă un RTO cât mai aproape de zero. Alte companii care pot tolera perioade mai lungi de oprire a sistemelor ar putea avea un RTO măsurat în săptămâni. Important este ca RTO să corespundă nevoilor de afaceri ale companiei.
Nu este necesar să existe un singur RTO în întreaga companie. Este perfect normal și rezonabil să existe un RTO mai strâns pentru aplicații mai critice și un RTO mai relaxat pentru restul centrului de date.
Obiectivul punctului de recuperare (RPO) este cantitatea de pierderi acceptabile după un incident mare, măsurat în timp. De exemplu, dacă suntem de acord că putem pierde date de o oră, am fost de acord cu un RPO de o oră. Totuși, majoritatea companiilor se bazează pe valori mult mai mari, cum ar fi 24 de ore sau mai mult. Acest lucru se datorează, în primul rând, cu cât RPO-ul este mai mic, cu atât mai des trebuie rulat sistemul de rezervă. Multe companii ar putea dori un RPO mai strâns, dar își dau seama că nu este posibil cu sistemul lor actual de backup. Ca și RTO, este perfect normal să existe mai multe RPO-uri în întreaga companie, în funcție de critica diferitelor seturi de date. Punctele de recuperare și valorile realității timpului de recuperare sunt măsurate numai dacă are loc o recuperare, indiferent dacă este real sau prin test.
Citiți și:
Backup-ul și recuperarea datelor intră într-o nouă eră
Fujitsu oferă mai multe opţiuni de backup cu noile aplicaţii Commvault HyperScale™