Záloha súboru. Záložný systém

ALEXEY BEREZHNOY, Systémový administrátor. Hlavné oblasti činnosti: virtualizácia a heterogénne siete. Ďalším koníčkom okrem písania článkov je popularizácia slobodného softvéru

Zálohovanie
Teória a prax. Zhrnutie

Na organizáciu systému Rezervovať kópiučo najefektívnejšie, musíte vybudovať skutočnú stratégiu na ukladanie a obnovu informácií

Zálohovanie (alebo, ako sa to tiež nazýva, zálohovanie - z anglického slova „backup“) je dôležitým procesom v živote akejkoľvek IT štruktúry. Ide o padák na záchranu v prípade nepredvídateľnej katastrofy. Zálohovanie zároveň slúži na vytvorenie akéhosi historického archívu podnikateľskej činnosti firmy za určité obdobie jej života. Pracovať bez zálohy je ako žiť pod holým nebom – počasie sa môže každú chvíľu pokaziť a nie je sa kam schovať. Ako ho však správne zorganizovať, aby ste neprišli o dôležité dáta a neminuli na ne fantastické sumy?

Články na tému organizácie záloh zvyčajne pojednávajú najmä o technických riešeniach a len občas sa venujú teórii a metodológii organizácie ukladania údajov.

Tento článok sa zameria na pravý opak: dôraz sa bude klásť na všeobecné pojmy, A technické prostriedky budú uvedené len ako príklady. To nám umožní abstrahovať od hardvéru a softvéru a odpovedať na dve hlavné otázky: "Prečo to robíme?", "Môžeme to urobiť rýchlejšie, lacnejšie a spoľahlivejšie?"

Ciele a ciele zálohovania

V procese organizácie zálohovania sú stanovené dve hlavné úlohy: obnova infraštruktúry v prípade porúch (Disaster Recovery) a udržiavanie archívu údajov s cieľom následne poskytnúť prístup k informáciám za minulé obdobia.

Klasickým príkladom záložnej kópie pre zotavenie po havárii je obraz systémového oddielu servera vytvorený spoločnosťou Acronis Pravdivý obraz.

Príkladom archívu môže byť mesačné sťahovanie databáz z 1C, zaznamenané na kazety a následné uloženie na špeciálne určenom mieste.

Existuje niekoľko faktorov, ktoré odlišujú rýchlu obnovu zálohy od archívu:

  • Doba uchovávania údajov. V prípade archívnych kópií to trvá pomerne dlho. V niektorých prípadoch to upravujú nielen obchodné požiadavky, ale aj zákon. Pre kópie obnovy po havárii je relatívne malý. Zvyčajne vytvárajú jednu alebo dve (so zvýšenými požiadavkami na spoľahlivosť) záložné kópie pre zotavenie po havárii s maximálnym intervalom jedného alebo dvoch dní, potom sa prepíšu novými. V obzvlášť kritických prípadoch je možné aktualizovať záložnú kópiu častejšie na obnovu po havárii, napríklad raz za niekoľko hodín.
  • Rýchly prístup k údajom. Rýchlosť prístupu k dlhodobému archívu nie je vo väčšine prípadov kritická. Potreba „získať údaje za obdobie“ zvyčajne vzniká v momente zosúladenia dokumentov, vráťte sa na predošlá verzia atď., teda nie v núdzovom režime. Ďalšou vecou je obnova po havárii, kedy je potrebné čo najskôr vrátiť potrebné dáta a výkon služby. V tomto prípade je mimoriadne dôležitým ukazovateľom rýchlosť prístupu k zálohe.
  • Zloženie skopírovaných informácií. Záložná kópia zvyčajne obsahuje iba používateľské a obchodné údaje za určité obdobie. Okrem týchto údajov obsahuje kópia určená na obnovu po havárii buď obrazy systému alebo kópie nastavení operačného systému a aplikačného softvéru, ako aj ďalšie informácie potrebné na obnovu.

Niekedy je možné tieto úlohy kombinovať. Napríklad ročné kompletné „snímky“ súborový server, plus zmeny vykonané počas týždňa. True Image je vhodný nástroj na vytvorenie takejto zálohy.

Najdôležitejšie je jasne pochopiť, prečo sa rezervácia vykonáva. Uvediem príklad: kritický SQL server zlyhal v dôsledku zlyhania diskového poľa. Jeden vhodný máme skladom Hardvér, takže riešením problému bolo iba obnovenie softvéru a údajov. Vedenie spoločnosti lieči pochopiteľná otázka: "Kedy to začne fungovať?" – a je nepríjemne prekvapený, keď sa dozvie, že zotavenie bude trvať celé štyri hodiny. Faktom je, že počas celej životnosti servera sa pravidelne zálohovali iba databázy bez toho, aby sa zohľadnila potreba obnovy samotného servera so všetkými nastaveniami, vrátane softvér samotný DBMS. Jednoducho povedané, naši hrdinovia uložili iba databázy a zabudli na systém.

Dovoľte mi uviesť ďalší príklad. Počas celého obdobia svojej práce mladý odborník vytvoril pomocou programu ntbackup jednu kópiu súborového servera pod Ovládanie Windows Server 2003 vrátane údajov a stavu systému v zdieľanom priečinku na inom počítači. Kvôli nedostatku miesto na disku táto kópia bola neustále prepisovaná. Po určitom čase bol požiadaný, aby obnovil predchádzajúcu verziu viacstranovej správy, ktorá bola pri ukladaní poškodená. Je jasné, že keďže nemal archivovanú históriu s vypnutou tieňovou kópiou, nemohol dokončiť túto požiadavku.

Na poznámku

Tieňová kópia, doslova – „tieňová kópia“. Poskytuje okamžité vytváranie kópií systém súborov tak, aby na ne ďalšie zmeny originálu nemali vplyv. Pomocou tejto funkcie je možné vytvárať viaceré skryté kópie súboru počas určitého časového obdobia, ako aj priebežné záložné kópie súborov otvorených na zápis. Za prevádzku tieňovej kópie je zodpovedná služba tieňovej kópie zväzku.

Stav systému, doslova – „stav systému“. System State Copy vytvára záložné kópie dôležitých komponentov operačné systémy Rodina Windows. To vám umožní obnoviť predtým nainštalovaný systém po zničení. Pri kopírovaní stavu systému sa uložia register, boot a ďalšie súbory dôležité pre systém, vrátane súborov na obnovenie Aktívny adresár, Databáza certifikačnej služby, registračná databáza COM+Class, adresáre SYSVOL. V operačných systémoch UNIX je nepriamym analógom kopírovania stavu systému ukladanie obsahu adresárov /etc, /usr/local/etc a iných súborov potrebných na obnovenie stavu systému.

Z toho vyplýva: musíte použiť oba typy zálohovania: na obnovu po havárii aj na archiváciu. V tomto prípade je potrebné určiť zoznam skopírovaných zdrojov, čas vykonávania úloh, ako aj to, kde, ako a ako dlho budú záložné kópie uložené.

S malým množstvom dát a nie príliš zložitou IT infraštruktúrou môžete skúsiť skombinovať obe tieto úlohy do jednej, napríklad vytvoriť dennú úplnú kópiu všetkých diskových partícií a databáz. Stále je však lepšie rozlišovať medzi dvoma cieľmi a pre každý z nich vybrať tie správne prostriedky. V súlade s tým sa pre každú úlohu používa iný nástroj, aj keď existujú aj univerzálne riešenia, ako napríklad rovnaký balík Acronis True Image alebo program ntbackup

Je zrejmé, že pri definovaní cieľov a zámerov zálohovania, ako aj riešení implementácie je potrebné vychádzať z obchodných požiadaviek.

Pri implementácii úlohy obnovy po havárii môžete použiť rôzne stratégie.

V niektorých prípadoch je potrebné priamo obnoviť systém na holý kov. Dá sa to urobiť napr programy Acronis True Image dodávaný s modulom Universal Restore. V tomto prípade je možné konfiguráciu servera vrátiť do prevádzky vo veľmi krátkom čase. Napríklad je celkom možné obnoviť partíciu s 20 GB operačným systémom zo zálohy za osem minút (za predpokladu, že záložná kópia je dostupná cez 1 Gb/s sieť).

V inej možnosti je účelnejšie nastavenia jednoducho „vrátiť“ do novo nainštalovaného systému, ako je napríklad skopírovanie konfiguračných súborov z priečinka /etc a iných v systémoch podobných UNIX (vo Windows to zhruba zodpovedá kopírovaniu a obnovenie stavu systému). Samozrejme, s týmto prístupom bude server uvedený do prevádzky najskôr po inštalácii operačného systému a obnovení potrebných nastavení, čo bude trvať oveľa viac dlhý termín. V každom prípade však rozhodnutie o tom, aký druh obnovy po havárii by malo byť, vyplýva z obchodných potrieb a obmedzení zdrojov.

Zásadný rozdiel medzi zálohovacími a redundantnými redundantnými systémami

Toto je ďalší záujem Spýtaj sa ktorej by som sa chcel dotknúť. Redundantné systémy redundancie zariadení znamenajú zavedenie určitej redundancie do hardvéru, aby sa zachovala funkčnosť v prípade náhleho zlyhania jedného z komponentov. Skvelý príklad v v tomto prípade– Pole RAID (Redundantné pole nezávislých diskov). V prípade zlyhania jedného disku sa môžete vyhnúť strate informácií a bezpečne ich nahradiť, čím ušetríte dáta vďaka špecifickej organizácii samotného diskového poľa (viac o RAID in).

Počul som frázu: „Máme veľmi spoľahlivé vybavenie, všade máme polia RAID, takže nepotrebujeme zálohy.“ Áno, samozrejme, rovnaké pole RAID ochráni dáta pred zničením v prípade zlyhania pevný disk. Ale z poškodenia dát počítačový vírus alebo vás to nezachráni pred nešikovnými používateľskými akciami. RAID vás nezachráni, ak sa súborový systém zrúti v dôsledku neoprávneného reštartu.

Mimochodom

Dôležitosť odlíšenia zálohovania od redundantných systémov by sa mala posúdiť pri zostavovaní plánu kopírovania údajov, či už ide o organizáciu alebo domáce počítače.

Opýtajte sa sami seba, prečo robíte kópie. Ak hovoríme o zálohovaní, tak to znamená ukladanie dát pri náhodnej (úmyselnej) akcii. Redundantná redundancia umožňuje uložiť dáta vrátane záložných kópií v prípade poruchy zariadenia.

V súčasnosti je na trhu veľa lacných zariadení, ktoré poskytujú spoľahlivé zálohovanie pomocou polí RAID resp cloudové technológie(napr. Amazon S3). Odporúča sa používať oba typy zálohovania informácií súčasne.

Andrej Vasiliev, CEO Qnap Rusko

Uvediem jeden príklad. Existujú prípady, keď sa udalosti vyvíjajú podľa nasledujúceho scenára: pri zlyhaní disku sa údaje obnovia prostredníctvom mechanizmu redundancie, najmä pomocou uložených kontrolných súčtov. V tomto prípade dôjde k výraznému zníženiu výkonu, server zamrzne a kontrola sa takmer stratí. Správca systému, ktorý nevidí iné východisko, reštartuje server so studeným reštartom (inými slovami, klikne na „RESETOVAŤ“). V dôsledku takéhoto živého preťaženia sa vyskytujú chyby súborového systému. Najlepšie, čo možno v tomto prípade očakávať, je, že program na kontrolu disku bude bežať dlhú dobu, aby sa obnovila integrita systému súborov. V najhoršom prípade sa budete musieť rozlúčiť so súborovým systémom a budete si lámať hlavu nad otázkou, kde, ako a v akom časovom rámci môžete obnoviť dáta a výkon servera.

Zálohovaniu sa nevyhnete ani v prípade, že máte klastrovú architektúru. Klaster prepnutia pri zlyhaní v podstate zachováva funkčnosť služieb, ktoré sú mu zverené, ak jeden zo serverov zlyhá. V prípade vyššie uvedených problémov, ako je vírusový útok alebo poškodenie údajov v dôsledku notoricky známeho „ľudského faktora“, vás nezachráni žiadny klaster.

Jediná vec, ktorá môže pôsobiť ako podradná náhrada zálohy za Disaster Recovery, je prítomnosť zrkadlového zálohovacieho servera s neustálou replikáciou dát z hlavného servera na záložný (podľa princípu Primary  Standby). V tomto prípade, ak zlyhá hlavný server, jeho úlohy prevezme záložný a nebudete musieť ani prenášať dáta. Organizácia takéhoto systému je však dosť nákladná a náročná na prácu. Nezabúdajme na potrebu neustálej replikácie.

Ukazuje sa, že takéto riešenie je nákladovo efektívne len v prípade kritických služieb s vysokými požiadavkami na odolnosť voči chybám a minimálnym časom obnovy. Takéto schémy sa spravidla používajú vo veľmi veľkých organizáciách s vysokým obratom komodít a hotovosti. A táto schéma je podradnou náhradou zálohy, pretože v každom prípade, ak sú dáta poškodené počítačovým vírusom, nešikovné akcie používateľov, resp. nesprávna práca aplikácia, údaje a softvér na oboch serveroch môžu byť ovplyvnené.

A, samozrejme, žiadny redundantný zálohovací systém nevyrieši problém s udržiavaním archívu dát po určitú dobu.

Koncept „záložného okna“

Vykonanie zálohy značne zaťažuje zálohovaný server. To platí najmä pre diskový subsystém a sieťové pripojenia. V niektorých prípadoch, keď má proces kopírovania dosť vysokú prioritu, to môže viesť k nedostupnosti určitých služieb. Okrem toho je kopírovanie údajov v čase vykonávania zmien spojené so značnými ťažkosťami. Samozrejme, existujú technické prostriedky, ako sa v tomto prípade vyhnúť problémom pri zachovaní integrity údajov, ale ak je to možné, je lepšie sa takémuto kopírovaniu za chodu vyhnúť.

Riešenie týchto vyššie popísaných problémov sa navrhuje samo: odložiť spustenie procesu vytvárania kópií na neaktívne obdobie, kedy bude vzájomný vplyv zálohovania a ostatných spustených systémov minimálny. Toto časové obdobie sa nazýva „okno zálohy“. Napríklad pre organizáciu fungujúcu podľa vzorca 8x5 (päť osemhodinových pracovných dní v týždni) sú takýmto „oknom“ zvyčajne víkendy a nočné hodiny.

Pre systémy pracujúce podľa vzorca 24x7 (celotýždenne 24 hodín denne) sa obdobie minimálnej aktivity používa ako obdobie, kedy nedochádza k vysokej záťaži serverov.

Typy zálohovania

Aby sa predišlo zbytočným nákladom na materiál pri organizovaní záloh a tiež, ak je to možné, neprekročili zálohovacie okno, bolo vyvinutých niekoľko zálohovacích technológií, ktoré sa používajú v závislosti od konkrétnej situácie.

Úplná záloha (alebo Úplná záloha)

Je to hlavná a základná metóda vytvárania záložných kópií, pri ktorej sa celé skopíruje vybrané dátové pole. Toto je najkompletnejší a najspoľahlivejší typ zálohy, hoci je najdrahší. Ak je potrebné uložiť niekoľko kópií údajov, celkový uložený objem sa zvýši úmerne k ich počtu. Na predchádzanie takémuto plytvaniu sa používajú kompresné algoritmy, ako aj kombinácia tejto metódy s inými typmi zálohovania: prírastkové alebo rozdielové. A samozrejme, úplná záloha je nevyhnutná, keď potrebujete pripraviť záložnú kópiu na rýchle obnovenie systému od začiatku.

Prírastková kópia

Na rozdiel od úplnej zálohy sa v tomto prípade neskopírujú všetky údaje (súbory, sektory atď.), ale iba tie, ktoré sa od poslednej kópie zmenili. Na určenie času kopírovania môžete použiť rôzne metódy Napríklad systémy s operačnými systémami rodiny Windows používajú zodpovedajúci atribút súboru (archivačný bit), ktorý sa nastaví pri úprave a vymazaní súboru zálohovacím programom. Iné systémy môžu použiť dátum úpravy súboru. Je jasné, že schéma využívajúca tento typ zálohy bude neúplná, ak sa z času na čas nevykoná plná záloha. Pri vykonávaní úplného obnovenia systému je potrebné obnoviť z poslednej kópie vytvorenej pomocou Úplnej zálohy a potom striedavo „zrolovať“ údaje z prírastkových kópií v poradí, v akom boli vytvorené.

Na čo slúži tento typ kopírovania? V prípade vytvárania archívnych kópií je potrebné znížiť spotrebované objemy na úložných zariadeniach (napríklad znížiť počet použitých páskových médií). To tiež minimalizuje čas potrebný na dokončenie úloh zálohovania, čo môže byť mimoriadne dôležité v podmienkach, keď musíte pracovať v nabitom programe 24 hodín denne, 7 dní v týždni alebo pumpovať veľké objemy informácií.

Existuje jedno upozornenie na postupné kopírovanie, ktoré potrebujete vedieť. Obnova krok za krokom vráti potrebné odstránené súbory počas obdobia zotavenia. Uvediem príklad. Povedzme, že cez víkendy sa vykonáva úplná záloha a cez pracovné dni prírastková. Používateľ vytvoril súbor v pondelok, v utorok ho zmenil, v stredu premenoval a vo štvrtok vymazal. Takže s postupnou, krok za krokom obnovou dát na týždenné obdobie, dostaneme dva súbory: so starým názvom v utorok pred premenovaním a s novým názvom vytvoreným v stredu. Stalo sa to preto, že sa uložili rôzne prírastkové kópie rôzne verzie rovnaký súbor a nakoniec sa obnovia všetky varianty. Preto pri postupnom obnovovaní údajov z archívu „tak, ako sú“, má zmysel rezervovať viac miesta na disku, aby sa doň zmestili aj vymazané súbory.

Diferenciálna záloha

Líši sa od prírastkovej v tom, že údaje sa skopírujú od posledného okamihu úplnej zálohy. Údaje sa v archíve ukladajú na „kumulatívnej báze“. V systémoch rodiny Windows je tento efekt dosiahnutý tým, že archívny bit sa počas rozdielového kopírovania neresetuje, takže zmenené údaje skončia v archívnej kópii, kým úplná kópia nevynuluje archívne bity.

Vzhľadom na to, že každá takto vytvorená nová kópia obsahuje dáta z predchádzajúcej, je to výhodnejšie pre kompletnú obnovu dát v čase katastrofy. Potrebujete na to iba dve kópie: úplnú a poslednú z rozdielových, takže dáta môžete priviesť späť k životu oveľa rýchlejšie, než postupne rozvinúť všetky prírastky. Tento typ kopírovania je navyše zbavený vyššie spomenutých funkcií prírastkového kopírovania, keď sa po úplnom obnovení staré súbory ako vták Phoenix znovu zrodia z popola. Je tu menší zmätok.

Rozdielové kopírovanie je však výrazne horšie ako prírastkové kopírovanie, pokiaľ ide o úsporu požadovaného miesta. Keďže každá nová kópia ukladá údaje z predchádzajúcich, celkový objem rezervovaných údajov môže byť porovnateľný s úplnou kópiou. A, samozrejme, pri plánovaní plánu (a výpočte, či sa proces zálohovania zmestí do časového okna), musíte vziať do úvahy čas potrebný na vytvorenie poslednej, najhrubšej, rozdielovej kópie.

Záložná topológia

Pozrime sa, aké schémy zálohovania existujú.

Decentralizovaná schéma

Jadrom tejto schémy je určitá všeobecnosť sieťový zdroj(pozri obr. 1). Napríklad zdieľaný priečinok alebo server FTP. Vyžaduje sa aj sada zálohovacích programov, ktoré z času na čas sťahujú informácie zo serverov a pracovných staníc, ako aj iných sieťových objektov (napr. konfiguračné súbory zo smerovačov) na tento zdroj. Tieto programy sú nainštalované na každom serveri a fungujú nezávisle od seba. Nepochybnou výhodou je jednoduchosť implementácie tejto schémy a jej nízke náklady. Ako programy na kopírovanie sú vhodné štandardné nástroje zabudované do operačného systému alebo softvéru, ako je DBMS. Môže to byť napríklad program ntbackup pre rodinu Windows, program tar pre operačné systémy podobné UNIX alebo súbor skriptov obsahujúcich vstavané príkazy SQL servera na uvoľnenie databáz do záložných súborov. Ďalšou výhodou je možnosť použitia rôzne programy a systémy, pokiaľ majú všetky prístup k cieľovému prostriedku na ukladanie záložných kópií.


Nevýhodou je nemotornosť tejto schémy. Keďže programy sa inštalujú nezávisle od seba, každý z nich musí byť nakonfigurovaný samostatne. Je dosť ťažké vziať do úvahy zvláštnosti harmonogramu a rozdeliť časové intervaly, aby sa predišlo konkurencii o cieľový zdroj. Monitorovanie je tiež náročné, proces kopírovania z každého servera sa musí monitorovať oddelene od ostatných, čo môže viesť k vysokým mzdovým nákladom.

Preto sa táto schéma používa v malých sieťach, ako aj v situáciách, keď nie je možné zorganizovať centralizovanú schému zálohovania pomocou dostupných prostriedkov. Viac Detailný popis Tento diagram a praktické usporiadanie nájdete v.

Centralizované zálohovanie

Na rozdiel od predchádzajúcej schémy je v tomto prípade použitý prehľadný hierarchický model pracujúci na princípe klient-server. V klasickej verzii sú na každom počítači nainštalované špeciálne agentské programy a serverový modul softvérového balíka je nainštalovaný na centrálnom serveri. Tieto systémy majú tiež špecializovanú konzolu na správu backendu. Schéma ovládania je nasledovná: z konzoly vytvárame úlohy na kopírovanie, obnovu, zhromažďovanie systémových informácií, diagnostiku atď. a server dáva agentom potrebné inštrukcie na vykonanie týchto operácií.

Práve na tomto princípe funguje väčšina populárnych zálohovacích systémov ako Symantec Backup Exec, CA Bright Store ARCServe Backup, Bacula a iné (pozri obr. 2).


Okrem rôznych agentov pre väčšinu operačných systémov existuje vývoj pre zálohovanie populárnych databáz a podnikových systémov, napríklad pre MS SQL Server, MS Exchange, Oracle Database a podobne.

Pre veľmi malé spoločnosti môžete v niektorých prípadoch vyskúšať zjednodušenú verziu centralizovanej schémy zálohovania bez použitia agentských programov (pozri obr. 3). Túto schému možno použiť aj vtedy, ak pre použitý zálohovací softvér nie je implementovaný špeciálny agent. Namiesto toho bude serverový modul využívať už existujúce služby. Napríklad „vyhrabávanie“ údajov zo skrytých zdieľané priečinky na serveroch Windows alebo kopírujte súbory cez SSH zo serverov so systémom UNIX. Táto schéma má veľmi významné obmedzenia spojené s problémami ukladania súborov otvorených na zápis. V dôsledku takýchto akcií otvorené súbory budú buď vynechané a nebudú zahrnuté do záložnej kópie, alebo budú skopírované s chybami. Existujú rôzne riešenia tohto problému, napríklad opätovné spustenie úlohy na skopírovanie iba predtým otvorených súborov, ale žiadne nie je spoľahlivé. Preto je táto schéma vhodná na použitie iba v určitých situáciách. Napríklad v malých organizáciách pracujúcich v režime 5x8 s disciplinovanými zamestnancami, ktorí pred odchodom domov ukladajú zmeny a zatvárajú súbory. Organizovať takúto skrátenú centralizovanú schému fungujúcu výlučne v Prostredie Windows ntbackup funguje dobre. Ak potrebujete použiť podobnú schému v heterogénnych prostrediach alebo výlučne medzi počítačmi UNIX, odporúčam sa pozrieť na Backup PC (pozri).

Obrázok 4. Zmiešaná schéma zálohovania

Čo je mimo lokality?

V našom turbulentnom, meniacom sa svete môžu nastať udalosti, ktoré môžu spôsobiť nepríjemné následky pre IT infraštruktúru a podnikanie ako celok. Napríklad požiar v budove. Alebo porucha batérie ústredného kúrenia v serverovni. Alebo banálne krádeže zariadení a komponentov. Jedným zo spôsobov, ako sa vyhnúť strate informácií v takýchto situáciách, je ukladať zálohy na miesto mimo hlavného umiestnenia. serverové vybavenie. Zároveň je potrebné zabezpečiť rýchly spôsob prístupu k údajom potrebným na obnovu. Opísaná metóda sa nazýva off-site (inými slovami, ukladanie kópií mimo územia podniku). V zásade sa používajú dva spôsoby organizácie tohto procesu.

Zápis údajov na vymeniteľné médiá a ich fyzický presun. V tomto prípade musíte zvážiť spôsob, ako rýchlo získať médiá späť v prípade zlyhania. Uložte ich napríklad v susednej budove. Výhodou tejto metódy je schopnosť organizovať tento proces bez akýchkoľvek ťažkostí. Nevýhodou je náročnosť vrátenia média a samotná potreba prenosu informácií na uskladnenie, ako aj riziko poškodenia média počas prepravy.

Kopírovanie údajov na iné miesto cez sieťové pripojenie. Napríklad pomocou tunela VPN cez internet. Výhodou v tomto prípade je, že nie je potrebné niekam dopravovať médiá s informáciami, nevýhodou je potreba použiť dostatočne široký kanál (spravidla je to veľmi drahé) a chrániť prenášané dáta (napr. rovnaká VPN). Ťažkosti, s ktorými sa stretávame pri prenose veľkých objemov údajov, možno výrazne znížiť použitím kompresných algoritmov alebo technológie deduplikácie.

Samostatne stojí za zmienku o bezpečnostných opatreniach pri organizácii ukladania údajov. V prvom rade treba dbať na to, aby sa dátové nosiče nachádzali v zabezpečenom priestore a aby boli prijaté opatrenia, ktoré zabránia neoprávneným osobám čítať dáta. Napríklad používať šifrovací systém, uzatvárať zmluvy o mlčanlivosti atď. Ak sa používa vymeniteľné médium, údaje na ňom musia byť tiež šifrované. Použitý systém označovania by nemal útočníkovi pomôcť pri analýze údajov. Na označovanie nosičov mien je potrebné použiť schému číslovania bez tváre prenesené súbory. Pri prenose dát po sieti je potrebné (ako už bolo napísané vyššie) použiť bezpečné metódy prenos dát, napríklad tunel VPN.

Diskutovali sme o hlavných bodoch pri organizovaní zálohy. Ďalšia časť sa pozrie na usmernenia a poskytuje praktické príklady na vytvorenie efektívneho zálohovacieho systému.

  1. Popis zálohy systém Windows, vrátane stavu systému – http://www.datamills.com/Tutorials/systemstate/tutorial.htm.
  2. Popis tieňovej kópie - http://ru.wikipedia.org/wiki/Shadow_Copy.
  3. Oficiálna webová stránka Acronis – http://www.acronis.ru/enterprise/products.
  4. Popis ntbackup - http://en.wikipedia.org/wiki/NTBackup.
  5. Berezhnoy A. Optimalizácia prevádzky MS SQL Server. //Správca systému, č. 1, 2008 – str. 14-22 ().
  6. Berezhnoy A. Organizujeme záložný systém pre malé a stredné kancelárie. //Správca systému, č. 6, 2009 – str. 14-23 ().
  7. Markelov A. Linux strážiaci Windows. Kontrola a inštalácia zálohovacieho systému BackupPC. //Správca systému, č. 9, 2004 – S. 2-6 ().
  8. Popis VPN – http://ru.wikipedia.org/wiki/VPN.
  9. Deduplikácia údajov – http://en.wikipedia.org/wiki/Data_deduplication.

V kontakte s

Od prírodných a človekom spôsobených katastrof, akcií votrelcov. Tieto technológie sa aktívne využívajú v IT infraštruktúrach organizácií rôznych odvetví a veľkostí.

Klasifikácia záloh

Podľa úplnosti uložených informácií

  • Úplná rezervácia(Plná záloha) - vytvorenie zálohy všetkých systémové súbory, zvyčajne vrátane stavu systému, registra a ďalších informácií potrebných na úplnú obnovu pracovných staníc. To znamená, že sa zálohujú nielen súbory, ale aj všetky informácie potrebné na fungovanie systému.
  • Dodatočná rezervácia(Prírastková záloha) - vytvorenie zálohy zo všetkých súborov, ktoré boli zmenené od predchádzajúcej úplnej alebo prírastkovej zálohy.
  • Rezervácia diferenciálu(Diferenciálna záloha) - vytvorenie zálohy zo všetkých súborov, ktoré boli zmenené od predchádzajúcej úplnej zálohy.
  • Selektívna rezervácia(Selektívna záloha) - vytvorenie zálohy iba z vybraných súborov.

Spôsobom prístupu k médiám

  • Prevádzková záloha(Online backup) - vytvorenie zálohy na trvalo pripojenom (priamo alebo cez sieť) médiu.
  • Offline rezervácia(Offline záloha) - uloženie záložnej kópie na vymeniteľné médiá, kazeta alebo cartridge, ktoré je potrebné pred použitím nainštalovať do mechaniky.

Pravidlá pre prácu so zálohovacími systémami

Pri používaní akejkoľvek zálohovacej technológie by ste mali dodržiavať niekoľko základných pravidiel, ktorých dodržiavanie zaistí maximálnu bezpečnosť dát v prípade nepredvídaných situácií.

  • Predbežné plánovanie. V procese plánovania musia byť zohľadnené všetky komponenty záložnej infraštruktúry a nesmú sa ignorovať všetky aplikácie, servery a trendy v kapacite primárneho úložiska.
  • Založenie životný cyklus a kalendár operácií. Všetky úlohy súvisiace so zálohovaním musia byť zdokumentované a vykonané podľa plánu. Nižšie je uvedený zoznam úloh, ktoré je potrebné vykonať denne:
    • monitorovanie úloh;
    • správy o neúspechu a úspechu;
    • analýza a riešenie problémov;
    • manipulácia s páskami a správa knižníc;
    • plánovanie úloh.
  • Denná kontrola protokolov procesov zálohovania. Keďže každé zlyhanie zálohovania môže viesť k mnohým ťažkostiam, musíte aspoň každý deň kontrolovať priebeh procesu zálohovania.
  • Chráňte svoju záložnú databázu alebo adresár. Každá zálohovacia aplikácia si udržiava vlastnú databázu, ktorej strata by mohla znamenať stratu záloh.
  • Definujte časové okno zálohovania denne. Ak časy vykonávania úlohy začnú prekračovať pridelené časové okno, je to znamenie, že systém sa blíži k limitom kapacity alebo že existujú slabé prepojenia vo výkone. Včasná detekcia takýchto príznakov môže zabrániť následným väčším zlyhaniam systému.
  • Lokalizácia a zachovanie „externých“ systémov a objemov. Je potrebné osobne overiť, či záložné kópie spĺňajú vaše očakávania, pričom sa spoliehajte predovšetkým na vaše pozorovania a nie na správy programu.
  • Maximálna možná centralizácia a automatizácia zálohovania. Konsolidácia viacerých úloh zálohovania do jednej výrazne zjednodušuje proces zálohovania.
  • Tvorba a podpora otvorených reportov, reportov o otvorených problémoch. Záznam nevyriešených problémov môže pomôcť vyriešiť ich čo najrýchlejšie a v dôsledku toho optimalizovať proces zálohovania.
  • Začlenenie zálohovania do procesu riadenia zmeny systému.
  • Konzultácie s predajcami. Malo by sa zabezpečiť, aby implementovaný systém plne spĺňal očakávania organizácie.

Zálohovacie technológie

Bezpečnosť

Zálohovanie sa zvyčajne vykonáva automaticky. Prístup k údajom si zvyčajne vyžaduje zvýšené oprávnenia. Takže proces, ktorý poskytuje zálohu, beží zdola účtu so zvýšenými privilégiami – tu sa vkráda určité riziko. Prečítajte si článok

Príprava nového servera na prevádzku by mala začať nastavením zálohy. Zdá sa, že o tom každý vie – no niekedy aj skúsený správcov systému robiť neodpustiteľné chyby. A tu nejde len o to, že úlohu nastavenia nového servera je potrebné vyriešiť veľmi rýchlo, ale aj o to, že nie je vždy jasné, ktorá metóda zálohovania by sa mala použiť.

Samozrejme, nie je možné vytvoriť ideálnu metódu, ktorá by vyhovovala každému: všetko má svoje pre a proti. Zároveň sa však zdá celkom reálne vybrať si metódu, ktorá najlepšie vyhovuje špecifikám konkrétneho projektu.

Pri výbere spôsobu zálohovania musíte najprv venovať pozornosť nasledujúcim kritériám:

  1. Rýchlosť (čas) zálohovania do úložiska;
  2. Rýchlosť (čas) obnovy zo záložnej kópie;
  3. Koľko kópií možno uchovávať s obmedzenou veľkosťou úložiska (server zálohovania);
  4. Objem rizík v dôsledku nekonzistentnosti záložných kópií, nevyvinutý spôsob vykonávania záloh, úplná alebo čiastočná strata záloh;
  5. Režijné náklady: úroveň zaťaženia vytvoreného na serveri pri kopírovaní, zníženie rýchlosti odozvy služby atď.
  6. Cena prenájmu všetkých použitých služieb.

V tomto článku si povieme o hlavných metódach zálohovania serverov so systémom Linux a o najbežnejších problémoch, s ktorými sa môžu začiatočníci stretnúť v tejto veľmi dôležitej oblasti správy systému.

Schéma na organizáciu ukladania a obnovy zo záložných kópií

Pri výbere schémy organizácie spôsobu zálohovania by ste mali venovať pozornosť nasledujúcim základným bodom:
  1. Zálohy nie je možné ukladať na rovnaké miesto ako zálohované údaje. Ak zálohu uložíte na rovnaké diskové pole ako vaše dáta, v prípade poškodenia hlavného diskového poľa o ňu prídete.
  2. Zrkadlenie (RAID1) nemožno porovnávať so zálohovaním. Raid vás ochráni iba pred hardvérovým problémom s jedným z diskov (a skôr či neskôr k takémuto problému dôjde, pretože diskový subsystém je takmer vždy prekážkou na serveri). Navyše pri použití hardvérových nájazdov hrozí zlyhanie ovládača, t.j. musíte si ponechať náhradný model.
  3. Ak zálohy ukladáte v rámci jedného racku v DC alebo jednoducho v rámci jedného DC, potom v tejto situácii existujú aj určité riziká (môžete si o tom prečítať napr.
  4. Ak ukladáte záložné kópie v rôznych DC, náklady na sieť a rýchlosť obnovy zo vzdialenej kópie sa prudko zvýšia.

Často je dôvodom obnovy dát poškodenie súborového systému alebo diskov. Tie. zálohy musia byť uložené niekde na samostatnom úložnom serveri. V tomto prípade môže byť problémom „šírka“ kanála na prenos údajov. Ak máte dedikovaný server, potom je veľmi vhodné vykonávať zálohy na samostatnom sieťovom rozhraní a nie na tom istom, ktoré si vymieňa údaje s klientmi. V opačnom prípade nemusia požiadavky vášho klienta „zapadnúť“ do obmedzeného komunikačného kanála. Alebo kvôli návštevnosti zákazníkov sa zálohy nebudú robiť včas.


Ďalej sa treba zamyslieť nad schémou a časom obnovy dát z hľadiska ukladania záloh. Môžete byť celkom spokojní so zálohou dokončenou za 6 hodín v noci na úložisku s obmedzenou rýchlosťou prístupu, ale 6-hodinová obnova vám pravdepodobne nebude vyhovovať. To znamená, že prístup k záložným kópiám by mal byť pohodlný a údaje by sa mali kopírovať dostatočne rýchlo. Napríklad obnova 1 TB dát so šírkou pásma 1 Gb/s bude trvať takmer 3 hodiny, a to v prípade, že vás neobmedzuje výkon diskového subsystému v úložisku a serveri. A nezabudnite k tomu pripočítať čas potrebný na zistenie problému, čas potrebný na rozhodnutie o vrátení späť, čas potrebný na kontrolu integrity obnovených údajov a množstvo následnej nespokojnosti medzi klientmi/kolegami .

Prírastkové zálohovanie

o prírastkové záloha skopíruje iba súbory, ktoré sa od predchádzajúcej zálohy zmenili. Nasledujúce prírastkové zálohy pridávajú iba súbory, ktoré sa od predchádzajúcej zálohy zmenili. V priemere trvá prírastkové zálohovanie menej času, pretože sa skopíruje menej súborov. Proces obnovy údajov však trvá dlhšie, pretože sa musia obnoviť údaje z poslednej úplnej zálohy a údaje zo všetkých nasledujúcich prírastkových záloh. V tomto prípade, na rozdiel od rozdielového kopírovania, zmenené alebo nové súbory nenahrádzajú staré, ale pridávajú sa na médium nezávisle.

Prírastkové kopírovanie sa najčastejšie vykonáva pomocou pomôcky rsync. S jeho pomocou môžete ušetriť úložný priestor, ak počet zmien za deň nie je príliš veľký. Ak sú zmenené súbory veľké, skopírujú sa úplne bez nahradenia predchádzajúcich verzií.

Proces zálohovania pomocou rsync možno rozdeliť do nasledujúcich krokov:

  1. Zostaví sa zoznam súborov na redundantnom serveri a v úložisku, pre každý súbor sa načítajú metadáta (oprávnenia, čas úpravy atď.) alebo kontrolný súčet (pri použití kľúča —checksum).
  2. Ak sa metadáta súborov líšia, súbor sa rozdelí na bloky a pre každý blok sa vypočíta kontrolný súčet. Bloky, ktoré sa líšia, sa nahrajú do úložiska.
  3. Ak dôjde k zmene súboru počas výpočtu kontrolného súčtu alebo prenosu súboru, jeho záloha sa opakuje od začiatku.
  4. V predvolenom nastavení rsync prenáša údaje cez SSH, čo znamená, že každý blok údajov je navyše šifrovaný. Rsync možno spustiť aj ako démona a prenášať dáta bez šifrovania pomocou svojho protokolu.

S viac detailné informácie Viac o tom, ako rsync funguje, sa dozviete na oficiálnej stránke.

Pre každý súbor funguje rsync veľmi dobre veľké množstvo operácií. Ak je na serveri veľa súborov alebo ak je procesor silne zaťažený, rýchlosť zálohovania sa výrazne zníži.

Zo skúseností môžeme povedať, že problémy na SATA diskoch (RAID1) začínajú približne po 200G dát na serveri. V skutočnosti všetko, samozrejme, závisí od počtu inódov. A v každom prípade sa táto hodnota môže posunúť jedným alebo druhým smerom.

Po určitom bode bude čas vykonania zálohy veľmi dlhý alebo jednoducho nebude dokončený za deň.

Aby sa neporovnávali všetky súbory, je tu lsyncd. Tento démon zhromažďuje informácie o zmenených súboroch, t.j. ich zoznam už budeme mať vopred pripravený na rsync. Malo by sa však vziať do úvahy, že to predstavuje ďalšiu záťaž diskový subsystém.

Diferenciálna záloha

o diferenciál V zálohe sa zakaždým zálohuje každý súbor, ktorý sa zmenil od poslednej úplnej zálohy. Rozdielové kopírovanie urýchľuje proces obnovy. Všetko, čo potrebujete, je najnovšia úplná a najnovšia rozdielová záloha. Rozdielové zálohy sú čoraz populárnejšie, pretože všetky kópie súborov sa vytvárajú v určitom čase, čo je napríklad veľmi dôležité pri infikovaní vírusmi.

Rozdielové zálohovanie sa vykonáva napríklad pomocou nástroja, ako je rdiff-backup. Pri práci s týmto nástrojom vznikajú rovnaké problémy ako pri prírastkových zálohách.

Vo všeobecnosti, ak pri hľadaní rozdielov v údajoch vykonáte úplné vyhľadávanie súborov, problémy tohto druhu zálohovania sú podobné problémom s rsync.

Chceli by sme osobitne poznamenať, že ak sa vo vašej schéme zálohovania skopíruje každý súbor samostatne, potom sa oplatí vymazať/vylúčiť súbory, ktoré nepotrebujete. Môžu to byť napríklad vyrovnávacie pamäte CMS. Takéto vyrovnávacie pamäte zvyčajne obsahujú veľa malých súborov, ktorých strata neovplyvní správnu činnosť servera.

Úplná záloha

Úplná záloha zvyčajne ovplyvňuje celý váš systém a všetky súbory. Týždenné, mesačné a štvrťročné zálohy zahŕňajú vytvorenie úplnej kópie všetkých údajov. Zvyčajne sa vykonáva v piatok alebo cez víkend, kedy kopírovanie veľkého množstva údajov neovplyvňuje prácu organizácie. Následné zálohy, ktoré sa vykonávajú od pondelka do štvrtka až do ďalšej úplnej zálohy, môžu byť rozdielové alebo prírastkové, predovšetkým kvôli úspore času a úložného priestoru. Úplné zálohovanie by sa malo vykonávať aspoň raz týždenne.

Väčšina súvisiacich publikácií odporúča vykonať úplnú zálohu raz alebo dvakrát týždenne a zvyšok času používať prírastkové a rozdielové zálohy. Takáto rada má svoj dôvod. Vo väčšine prípadov stačí úplná záloha raz týždenne. Má zmysel spustiť ho znova, ak nemáte možnosť aktualizovať úplnú zálohu na strane úložiska a zabezpečiť správnosť záložnej kópie (môže to byť potrebné napríklad v prípadoch, keď z nejakého dôvodu neverte skriptom, ktoré máte, ani zálohovaciemu softvéru.

V skutočnosti možno úplnú zálohu rozdeliť na 2 časti:

  1. Úplná záloha na úrovni súborového systému;
  2. Úplná záloha na úrovni zariadenia.

Pozrime sa na ich charakteristické vlastnosti na príklade:
root@komarov:~# df -h Veľkosť súborového systému Použitá Avail Použitie % Namontované na /dev/mapper/komarov_system-root 3.4G 808M 2.4G 25% / /dev/mapper/komarov_system-home 931G 439G 493G 3M 3v% /houde 4,0 tis. 383 mil. 1% /vývoj tmpfs 107 mil. 104 tis. 107 mil. 22M 109M 17% /top

Budeme iba rezervovať /domov. Všetko ostatné sa dá rýchlo obnoviť ručne. Môžete tiež nasadiť server so systémom správy konfigurácie a pripojiť k nemu náš /home.

Úplná záloha na úrovni súborového systému

Typický predstaviteľ: skládka.

Pomôcka vytvorí „výpis“ súborového systému. Môžete vytvoriť nielen plnú, ale aj prírastkovú zálohu. dump pracuje s tabuľkou inode a „rozumie“ štruktúre súborov (takže riedke súbory sú komprimované).
Ukladanie spusteného súborového systému je „hlúpe a nebezpečné“, pretože systém súborov sa môže počas vytvárania výpisu zmeniť. Musí byť vytvorený zo snímky (o niečo neskôr podrobnejšie rozoberieme funkcie práce so snímkami), pripojeného alebo zmrazeného súborového systému.

Táto schéma závisí aj od počtu súborov a čas jej vykonávania sa bude zvyšovať s množstvom dát na disku. Dump má zároveň vyššiu prevádzkovú rýchlosť ako rsync.
Ak potrebujete obnoviť nie celú záložnú kópiu, ale napríklad iba niekoľko náhodne poškodených súborov), obnovenie takýchto súborov pomocou nástroja na obnovenie môže trvať príliš dlho.

Úplná záloha na úrovni zariadenia

  1. mdraid a DRBD
    V skutočnosti je RAID1 nakonfigurovaný s diskom/raidom na serveri a sieťový disk a z času na čas (na základe frekvencie zálohovania) prídavný disk synchronizované s hlavným diskom/raidom na serveri.

    Najväčším plusom je rýchlosť. Trvanie synchronizácie závisí len od počtu zmien vykonaných za posledný deň.
    Tento zálohovací systém sa používa pomerne často, no málokto si uvedomuje, že záložné kópie získané s jeho pomocou môžu byť neúčinné a tu je dôvod. Po dokončení synchronizácie disku sa disk s záložná kópia vypnúť. Ak napríklad máme spustený DBMS, ktorý zapisuje údaje lokálny diskčasti, ukladajúce prechodné dáta do vyrovnávacej pamäte, nie je zaručené, že skončia aj na záložnom disku. V najlepšom prípade stratíme časť údajov, ktoré sa menia. Preto takéto zálohy možno len ťažko považovať za spoľahlivé.

  2. LVM+dd
    Snímky sú skvelým nástrojom na vytváranie konzistentných záloh. Pred vytvorením snímky musíte resetovať vyrovnávaciu pamäť FS a vášho softvéru na diskový subsystém.

Napríklad so samotným MySQL by to vyzeralo takto:
$ sudo mysql -e "VYPLACHUJTE TABUĽKY POMOCOU ZÁMKU NA ČÍTANIE;" $ sudo mysql -e "FLUSH LOGS;" $ sudo sync $ sudo lvcreate -s -p r -l100%zadarmo -n %s_backup /dev/vg/%s $ sudo mysql -e "ODMOKOVAŤ TABUĽKY;"

* Kolegovia rozprávajú príbehy o tom, ako niekoho „zámok čítania“ niekedy viedol k zablokovaniu, ale v mojej pamäti sa to nikdy nestalo.

Zálohy DBMS je možné vytvárať samostatne (napríklad pomocou binárnych protokolov), čím sa eliminujú prestoje počas resetovania vyrovnávacej pamäte. Môžete tiež vytvoriť výpisy v úložisku spustením inštancie DBMS tam. Zálohovanie rôznych DBMS je téma pre samostatné publikácie.

Snímku môžete skopírovať pomocou obnovenia (napríklad rsync s opravou na kopírovanie blokových zariadení bugzilla.redhat.com/show_bug.cgi?id=494313), môžete blokovať po bloku a bez šifrovania (netcat, ftp). Bloky môžete prenášať v komprimovanej forme a pripojiť ich do úložiska pomocou AVFS a na server pripojiť oddiel so zálohami cez SMB.

Kompresia odstraňuje problémy s prenosovou rýchlosťou, preťažením kanálov a úložným priestorom. Ak však nepoužívate AVFS v úložisku, potom vám obnovenie iba časti údajov zaberie veľa času. Ak používate AVFS, stretnete sa s jeho „vlhkosťou“.
Alternatívou blokovej kompresie je squashfs: k serveru môžete pripojiť napríklad oddiel Samba a spustiť mksquashfs, ale tento nástroj pracuje aj so súbormi, t.j. závisí od ich množstva.

Navyše pri vytváraní squashfov sa plytvá pomerne veľkým množstvom RAM, čo môže ľahko viesť k volaniu oom-killer.

Bezpečnosť

Je potrebné sa chrániť pred situáciou, kedy dôjde k napadnutiu úložiska alebo vášho servera. Ak je server napadnutý, je lepšie, aby používateľ, ktorý tam zapisuje údaje, nemal práva na mazanie/zmenu súborov v úložisku.
Ak je úložisko napadnuté, je tiež vhodné maximálne obmedziť práva používateľa zálohovania na serveri.

Ak je možné odpočúvať záložný kanál, je potrebné šifrovanie.

Záver

Každý zálohovací systém má svoje klady a zápory. V tomto článku sme sa pokúsili zdôrazniť niektoré nuansy pri výbere zálohovacieho systému. Dúfame, že pomôžu našim čitateľom.

Výsledkom je, že pri výbere zálohovacieho systému pre váš projekt musíte vykonať testy zvoleného typu zálohy a venovať pozornosť:

  • čas zálohovania v aktuálnej fáze projektu;
  • čas zálohovania v prípade, že je údajov oveľa viac;
  • zaťaženie kanála;
  • zaťaženie diskového subsystému na serveri a v úložisku;
  • čas na obnovenie všetkých údajov;
  • čas obnovy pre pár súborov;
  • potreba konzistentnosti údajov, najmä databáz;
  • spotreba pamäte a prítomnosť oom-killer hovorov;

Ako zálohovacie riešenia môžete použiť supload a naše cloudové úložisko.
Čitatelia, ktorí tu nemôžu zanechať komentár, sú pozvaní, aby sa k nám pridali na blogu.

Štítky: Pridajte štítky