Akú technológiu používa raid 5? Typy polí RAID

O koncepte diskových polí RAID už počulo veľa používateľov, no v praxi si málokto predstaví, čo to je. Ale ako sa ukazuje, nie je tu nič zložité. Pozrime sa na podstatu tohto pojmu, ako sa hovorí, na prstoch, na základe vysvetlenia informácií pre bežného človeka.

Čo sú diskové polia RAID?

Najprv sa pozrime na všeobecný výklad, ktorý ponúkajú online publikácie. Diskové polia sú celé systémy na ukladanie informácií pozostávajúce z kombinácie dvoch alebo viacerých pevné disky, slúžiace buď na zvýšenie rýchlosti prístupu k uloženým informáciám, alebo na ich duplikovanie, napríklad pri ukladaní záložných kópií.

V tejto kombinácii počet pevných diskov z hľadiska inštalácie teoreticky nemá žiadne obmedzenia. Všetko závisí len od toho, koľko pripojení základná doska podporuje. Prečo sa vlastne používajú diskové polia RAID? Tu stojí za to venovať pozornosť skutočnosti, že v smere vývoja technológie (vo vzťahu k pevným diskom) už dlho zamrzli v jednom bode (rýchlosť vretena 7200 otáčok za minútu, veľkosť vyrovnávacej pamäte atď.). Výnimkou sú v tomto smere iba SSD modely, no aj tie hlavne len zväčšujú objem. Zároveň pri výrobe procesorov či pásikov Náhodný vstup do pamäťe pokrok je výraznejší. Vďaka použitiu polí RAID je teda zvýšený výkon pri prístupe k pevným diskom.

Diskové polia RAID: typy, účel

Pokiaľ ide o samotné polia, môžu byť podmienene rozdelené podľa použitého číslovania (0, 1, 2 atď.). Každé takéto číslo zodpovedá výkonu jednej z deklarovaných funkcií.

Hlavnými v tejto klasifikácii sú diskové polia s číslami 0 a 1 (neskôr bude jasné prečo), keďže práve im sú priradené hlavné úlohy.

Pri vytváraní polí s viacerými pripojenými pevnými diskami by ste mali najprv použiť nastavenia systému BIOS, kde je sekcia konfigurácie SATA nastavená na RAID. Je dôležité poznamenať, že pripojené jednotky musia mať absolútne identické parametre, pokiaľ ide o objem, rozhranie, pripojenie, vyrovnávaciu pamäť atď.

RAID 0 (pruhovanie)

Nulové diskové polia sú v podstate navrhnuté tak, aby urýchlili prístup k uloženým informáciám (zápis alebo čítanie). Spravidla môžu mať v kombinácii dva až štyri pevné disky.

Hlavným problémom je však to, že keď vymažete informácie na jednom z diskov, zmiznú aj na ostatných. Informácie sa zapisujú vo forme blokov striedavo na každý disk a nárast výkonu je priamo úmerný počtu pevných diskov (čiže štyri disky sú dvakrát rýchlejšie ako dva). Strata informácií je však spôsobená iba skutočnosťou, že bloky môžu byť umiestnené na rôznych diskoch, hoci používateľ v rovnakom „Prieskumníkovi“ vidí súbory v normálnom zobrazení.

RAID 1

Diskové polia s jednotným označením patria do kategórie Mirroring a slúžia na šetrenie dát duplikovaním.

Zhruba povedané, v tomto stave vecí používateľ trochu stráca na produktivite, ale môže si byť istý, že ak údaje z jedného oddielu zmiznú, uložia sa do iného.

RAID 2 a vyššie

Polia s číslom 2 a vyššie majú dvojaký účel. Na jednej strane sú určené na zaznamenávanie informácií, na druhej strane slúžia na opravu chýb.

Inými slovami, diskové polia tohto typu kombinujú možnosti RAID 0 a RAID 1, no nie sú medzi počítačovými vedcami obzvlášť obľúbené, hoci ich fungovanie je založené na využití

Čo je lepšie použiť v praxi?

Samozrejme, ak má počítač používať programy náročné na zdroje, napríklad moderné hry, je lepšie použiť polia RAID 0. V prípade práce s dôležitá informácia, ktoré je potrebné akýmkoľvek spôsobom uložiť, budete musieť prejsť na polia RAID 1. Vzhľadom na to, že zväzky s číslami od dvoch a vyššie sa nestali populárnymi, ich použitie je určené výlučne želaním používateľa. Mimochodom, použitie nulových polí je praktické aj vtedy, ak používateľ často sťahuje do počítača multimediálne súbory, povedzme, filmy alebo hudbu s vysokým bitrate pre formát MP3 alebo v štandarde FLAC.

Vo zvyšku sa budete musieť spoľahnúť na svoje vlastné preferencie a potreby. Použitie tohto alebo toho poľa bude závisieť od toho. A samozrejme, pri inštalácii zväzku je lepšie dať prednosť SSD disky, keďže v porovnaní s bežnými pevnými diskami majú už na začiatku vyššiu rýchlosť zápisu a čítania. Ale musia byť úplne identické vo svojich charakteristikách a parametroch, inak pripojená kombinácia jednoducho nebude fungovať. A to je presne jedna z najdôležitejších podmienok. Takže budete musieť venovať pozornosť tomuto aspektu.

Takmer každý pozná príslovie „Kým neudrie hrom, človek sa nepokríži“. Je to životne dôležité: kým sa tento alebo ten problém nedotkne používateľa, ani o tom nebude premýšľať. Napájací zdroj zomrel a vzal so sebou niekoľko zariadení - používateľ sa ponáhľa hľadať články na relevantné témy o chutnom a zdravom jedle. Procesor vyhorel alebo začal chybne fungovať v dôsledku prehriatia - v časti „Obľúbené“ sa objavilo niekoľko odkazov na rozľahlé vlákna fóra, kde sa diskutuje o chladení procesora.

Je to rovnaký príbeh s pevnými diskami: akonáhle ďalšia skrutka, ktorá si rozbila hlavu, opustí náš smrteľný svet, majiteľ PC sa začne snažiť zabezpečiť zlepšenie životných podmienok disku. No ani ten najprepracovanejší chladič nedokáže zaručiť dlhú a šťastnú životnosť disku. Životnosť disku je ovplyvnená mnohými faktormi: výrobnými chybami a náhodným kopnutím do skrine (najmä ak telo stojí niekde na podlahe), prachom prechádzajúcim cez filtre a vysokonapäťovým rušením vysielaným napájanie... Existuje len jedna cesta von - zálohovanie informácie a ak potrebujete zálohovanie na cestách, potom je čas vybudovať pole RAID, pretože dnes má takmer každá základná doska nejaký radič RAID.

Na tomto mieste sa zastavíme a urobíme si krátky exkurz do histórie a teórie RAID polí. Samotná skratka RAID znamená Redundant Array of Independent Disks. Predtým sa namiesto nezávislých používalo lacné, ale časom táto definícia stratila svoj význam: takmer všetky diskové jednotky sa stali lacnými.

História RAID sa začala písať v roku 1987, kedy bol publikovaný článok „Enclosure for Redundant Arrays of Low-Cost Disks (RAID)“ podpísaný súdruhmi Petersonom, Gibsonom a Katzom. Článok popisoval technológiu kombinovania niekoľkých bežných diskov do poľa na získanie rýchlejšieho a spoľahlivejšieho disku. Autori materiálu tiež čitateľom povedali o niekoľkých typoch polí - od RAID-1 po RAID-5. Následne sa k poliam popísaným pred takmer dvadsiatimi rokmi pridalo pole RAID s nulovou úrovňou, ktoré si získalo popularitu. Čo sú teda všetky tieto RAID-x? Aká je ich podstata? Prečo sa nazývajú nadbytočné? Pokúsime sa to zistiť.

Veľmi povedané jednoduchým jazykom, potom je RAID vec, ktorá umožňuje operačnému systému, aby nevedel, koľko diskov je nainštalovaných v počítači. Kombinácia pevných diskov do poľa RAID je proces, ktorý je priamo opačný k rozdeleniu jedného priestoru logické disky: tvoríme jeden logický disk založený na niekoľkých fyzických. K tomu budeme potrebovať buď príslušný softvér (o tejto možnosti sa ani nebudeme baviť - je to zbytočná vec), alebo RAID radič zabudovaný v základnej doske, prípadne samostatný vložený do PCI alebo PCI Express. slot. Je to radič, ktorý spája disky do poľa a operačný systém Už to nefunguje s HDD, ale s ovládačom, ktorý mu nehovorí nič zbytočné. Existuje však veľa možností, ako spojiť niekoľko diskov do jedného, ​​presnejšie asi desať.

Aké sú typy RAID?

Najjednoduchším z nich je JBOD (Just a Bunch of Disks). Dva pevné disky sú zlepené do jedného v sérii, informácie sa zapisujú najskôr na jeden a potom na druhý disk bez toho, aby sa rozbili na kúsky a bloky. Z dvoch 200 GB diskov vyrobíme jeden 400 GB disk, ktorý pracuje takmer rovnakou a v skutočnosti o niečo nižšou rýchlosťou ako každý z týchto dvoch diskov.

JBOD je špeciálny prípad poľa úrovne 0, RAID-0. Existuje aj ďalší variant názvu polí na tejto úrovni – stripe (strip), celý názov je Striped Disk Array without Fault Tolerance. Táto možnosť zahŕňa aj spojenie n diskov do jedného s kapacitou zväčšenou n-krát, ale disky sa nekombinujú postupne, ale paralelne a informácie sa na ne zapisujú v blokoch (veľkosť bloku určuje používateľ pri vytváraní RAID pole).

To znamená, že ak potrebujete zapísať postupnosť čísel 123456 na dve jednotky zahrnuté v poli RAID-0, radič rozdelí tento reťazec na dve časti - 123 a 456 - a zapíše prvú na jeden disk a druhú na ostatný. Každý disk dokáže prenášať dáta... no, rýchlosťou 50 MB/s a celková rýchlosť dvoch diskov, z ktorých sa dáta paralelne berú, je 100 MB/s. Rýchlosť práce s dátami by sa teda mala zvýšiť n-krát (v skutočnosti je nárast rýchlosti samozrejme menší, keďže straty za vyhľadávanie dát a ich prenos po zbernici nikto nezrušil). Ale toto zvýšenie nie je dané nadarmo: ak zlyhá aspoň jeden disk, informácie z celého poľa sa stratia.

Úroveň RAID nula. Dáta sú rozdelené do blokov a rozptýlené po diskoch. Neexistuje žiadna parita ani nadbytočnosť.

To znamená, že neexistuje žiadna nadbytočnosť a už vôbec nie. Toto pole možno považovať za pole RAID iba podmienečne, je však veľmi populárne. Len málo ľudí premýšľa o spoľahlivosti; nedá sa merať referenčnými hodnotami, ale každý rozumie reči megabajtov za sekundu. To nie je zlé ani dobré, jednoducho sa to stáva. Nižšie budeme hovoriť o tom, ako jesť ryby a udržiavať spoľahlivosť. Obnova RAID-0 po zlyhaní

Mimochodom, ďalšou nevýhodou pruhového poľa je, že nie je prenosný. Nechcem tým povedať, že netoleruje niektoré druhy jedál alebo napríklad svojich majiteľov. Nestará sa o to, ale presunúť samotné pole niekam je celý problém. Aj keď pretiahnete disky a ovládače radičov svojmu priateľovi, nie je pravda, že budú definované ako jedno pole a dáta budú môcť byť použité. Okrem toho existujú prípady, keď jednoduché pripojenie (bez akéhokoľvek zapisovania!) pásikových diskov k „nenatívnemu“ (odlišnému od toho, na ktorom bolo pole vytvorené) radiču viedlo k poškodeniu informácií v poli. Nevieme, aký dôležitý je tento problém teraz, s príchodom moderných ovládačov, ale stále vám odporúčame byť opatrní.


Pole RAID 1 úrovne so štyrmi diskami. Disky sú rozdelené do párov a jednotky v rámci páru ukladajú rovnaké údaje.

Prvým skutočne „nadbytočným“ poľom (a prvým RAID, ktorý sa objavil) bol RAID-1. Jeho druhý názov - zrkadlo - vysvetľuje princíp činnosti: všetky disky pridelené pre pole sú rozdelené do párov a informácie sa čítajú a zapisujú na oba disky naraz. Ukazuje sa, že každý z diskov v poli má presnú kópiu. V takomto systéme sa zvyšuje nielen spoľahlivosť ukladania dát, ale aj rýchlosť ich čítania (čítať môžete z dvoch pevných diskov naraz), aj keď rýchlosť zápisu zostáva rovnaká ako pri jednom disku.

Ako možno uhádnete, objem takéhoto poľa sa bude rovnať polovici súčtu objemov všetkých pevných diskov, ktoré sú v ňom zahrnuté. Nevýhodou tohto riešenia je, že potrebujete dvakrát toľko pevných diskov. Ale spoľahlivosť tohto poľa sa v skutočnosti ani nerovná dvojnásobnej spoľahlivosti jedného disku, ale je oveľa vyššia ako táto hodnota. Porucha dvoch pevných diskov v rámci... no, povedzme, deň je nepravdepodobná, pokiaľ napríklad nezasiahne napájanie. Zároveň každý rozumný človek, ktorý vidí, že jeden disk z páru zlyhal, ho okamžite vymení a aj keď hneď potom zlyhá druhý disk, informácie nikam nejdú.

Ako vidíte, RAID-0 aj RAID-1 majú svoje nevýhody. Ako sa ich môžem zbaviť? Ak máte aspoň štyri pevné disky, môžete vytvoriť konfiguráciu RAID 0+1. Na tento účel sa polia RAID-1 kombinujú do poľa RAID-0. Alebo naopak, niekedy sa pole RAID-1 vytvorí z viacerých polí RAID-0 (výsledkom je RAID-10, ktorého jedinou výhodou je kratší čas na obnovu dát pri výpadku jedného disku).

Spoľahlivosť takejto konfigurácie štyroch pevných diskov sa rovná spoľahlivosti poľa RAID-1 a rýchlosť je vlastne rovnaká ako pri RAID-0 (v skutočnosti bude s najväčšou pravdepodobnosťou o niečo nižšia z dôvodu obmedzeného schopnosti ovládača). Súčasne zlyhanie dvoch diskov nemusí vždy znamenať úplnú stratu informácií: k tomu dôjde iba vtedy, ak zlyhajú disky obsahujúce rovnaké údaje, čo je nepravdepodobné. To znamená, že ak sú štyri disky rozdelené do párov 1-2 a 3-4 a tieto páry sú spojené do poľa RAID-0, potom iba súčasné zlyhanie diskov 1 a 2 alebo 3 a 4 povedie k strate dát, pričom v prípade predčasnej smrti prvého a tretieho, druhého a štvrtého, prvého a štvrtého alebo druhého a tretieho pevného disku zostanú dáta v bezpečí.

Hlavnou nevýhodou RAID-10 sú však vysoké náklady na disky. Cenu štyroch (minimálnych!) pevných diskov však nemožno nazvať malou, najmä ak máme skutočne k dispozícii kapacitu iba dvoch z nich (ako sme už povedali málokto, myslí na spoľahlivosť a koľko to stojí). Veľká (100 %) nadbytočnosť dátového úložiska je cítiť. To všetko viedlo k tomu, že v poslednej dobe si získal popularitu variant poľa s názvom RAID-5. Na jeho implementáciu potrebujete tri disky. Okrem samotných informácií ukladá radič na diskové jednotky aj bloky parity.

Nebudeme zachádzať do podrobností o tom, ako funguje algoritmus kontroly parity, povieme len, že ak dôjde k strate informácií na jednom z diskov, umožňuje vám to obnoviť pomocou paritných údajov a živých údajov z iných diskov. Paritný blok má objem jedného fyzického disku a je rovnomerne rozmiestnený na všetkých pevných diskoch systému, takže strata ktoréhokoľvek disku umožňuje obnoviť z neho informácie pomocou paritného bloku umiestneného na inom disku poľa. Informácie sú rozdelené do veľkých blokov a zapísané na disky jeden po druhom, teda podľa princípu 12-34-56 v prípade trojdiskového poľa.

Celkový objem takéhoto poľa je teda objem všetkých diskov mínus kapacita jedného z nich. Obnova dát, samozrejme, nenastane okamžite, ale takýto systém má vysoký výkon a mieru spoľahlivosti pri minimálnych nákladoch (pre 1000 GB pole potrebujete šesť 200 GB diskov). Výkon takéhoto poľa však bude stále nižší ako rýchlosť páskového systému: pri každej operácii zápisu musí radič aktualizovať aj index parity.

RAID-0, RAID-1 a RAID 0+1, niekedy aj RAID-5 - tieto úrovne najčastejšie vyčerpávajú možnosti stolných RAID radičov. Viac vysoké úrovne dostupné iba pre zložité systémy založené na pevných diskoch SCSI. Avšak šťastní majitelia SATA radičov s podporou Matrix RAID (takéto radiče sú zabudované v južných mostoch ICH6R a ICH7R z r. Intel) môžu využívať výhody polí RAID-0 a RAID-1 iba s dvoma diskami a tie s kartou s ICH7R môžu kombinovať RAID-5 a RAID-0, ak majú štyri rovnaké disky.

Ako sa to realizuje v praxi? Pozrime sa na jednoduchší prípad s RAID-0 a RAID-1. Povedzme, že ste si kúpili dva 400 GB pevné disky. Každý disk rozdelíte na 100 GB a 300 GB logické disky. Potom pomocou pomôcky Intel Application Accelerator RAID Option ROM zabudovanej v BIOSe skombinujete 100 GB partície do pásikavého poľa (RAID-0) a 300 GB partícií do zrkadlového poľa (RAID-1). Teraz na rýchly disk s kapacitou 200 GB môžete ukladať povedzme hračky, video materiál a ďalšie dáta, ktoré vyžadujú vysokú rýchlosť diskového subsystému a navyše nie sú veľmi dôležité (teda tie, ktoré budete stratu neľutujem) a na zrkadlovú 300 GB gigabajtovú jednotku presúvate pracovné dokumenty, archívy pošty, obslužný softvér a ďalšie dôležité súbory. Ak jeden disk zlyhá, stratíte to, čo bolo umiestnené na pásikovom poli, ale údaje, ktoré ste umiestnili na druhý logický disk, sa duplikujú na zostávajúcom disku.

Združenie Úrovne RAID-5 a RAID-0 znamenajú, že časť objemu štyroch diskov je alokovaná pre rýchle pruhové pole a druhá časť (nech je to 300 GB na každom disku) pripadá na dátové bloky a paritné bloky, to znamená, jeden ultrarýchly disk s kapacitou 400 GB (4 x 100 GB) a jedno spoľahlivé, ale pomalšie 900 GB pole 4 x 300 GB mínus 300 GB pre paritné bloky.

Ako vidíte, táto technológia je mimoriadne sľubná a bolo by pekné, keby ju podporovali aj iní výrobcovia čipsetov a ovládačov. Je veľmi lákavé mať polia rôznych úrovní na dvoch diskoch, rýchle a spoľahlivé.

Toto sú snáď všetky typy polí RAID, ktoré sa používajú v domácich systémoch. V živote sa však môžete stretnúť s RAID-2, 3, 4, 6 a 7. Poďme sa teda ešte pozrieť, aké sú tieto úrovne.

RAID-2. V poli tohto typu sú disky rozdelené do dvoch skupín – na dáta a na kódy na opravu chýb a ak sú dáta uložené na n diskoch, tak na uloženie opravných kódov je potrebných n-1 diskov. Dáta sa zapisujú na príslušné pevné disky rovnakým spôsobom ako v RAID-0, sú rozdelené do malých blokov podľa počtu diskov určených na ukladanie informácií. Na zvyšných diskoch sú uložené kódy na opravu chýb, ktoré možno použiť na obnovenie informácií, ak niektorý pevný disk zlyhá. Hammingova metóda sa už dlho používa v ECC pamäti a umožňuje okamžitú opravu malých jednobitových chýb, ak sa náhle vyskytnú, a ak sa dva bity prenesú nesprávne, opäť sa to zistí pomocou paritných systémov. Nikto však nechcel na tento účel ponechať objemnú štruktúru s takmer dvojnásobným počtom diskov a tento typ poľa sa nerozšíril.

Štruktúra poľa RAID-3 je toto: v poli n diskov sú dáta rozdelené do 1-bajtových blokov a distribuované medzi n-1 diskov a ďalší disk sa používa na ukladanie paritných blokov. RAID-2 mal na tento účel n-1 diskov, ale väčšina informácií na týchto diskoch sa používala len na priebežnú opravu chýb a na ľahké zotavenie v prípade poruchy disku stačí menšie množstvo, stačí jeden vyhradený pevný disk.


RAID úrovne 3 so samostatným diskom na ukladanie informácií o parite. Neexistuje žiadna záloha, ale údaje sa dajú obnoviť.

Preto sú rozdiely medzi RAID-3 a RAID-2 zrejmé: nemožnosť priebežnej opravy chýb a menšia redundancia. Výhody sú nasledovné: rýchlosť čítania a zápisu dát je vysoká a na vytvorenie poľa je potrebných len veľmi málo diskov, iba tri. Pole tohto typu je však dobré iba na jednoúlohovú prácu s veľkými súbormi, pretože pri nich dochádza k problémom s rýchlosťou časté žiadosti malé množstvo dát.


Pole úrovne 5 sa líši od RAID-3 tým, že paritné bloky sú rovnomerne rozdelené na všetky disky v poli.

RAID-4 podobný RAID-3, ale líši sa od neho tým, že dáta sú rozdelené do blokov a nie bajtov. Tak bolo možné „poraziť“ problém nízkej rýchlosti prenosu dát malých objemov. Zápis je pomalý kvôli skutočnosti, že parita pre blok sa generuje počas nahrávania a zapisuje sa na jeden disk. Polia tohto typu sa používajú veľmi zriedkavo.

RAID-6- toto je rovnaký RAID-5, ale teraz sú na každom z diskov poľa uložené dva paritné bloky. Ak teda zlyhajú dva disky, informácie je stále možné obnoviť. Samozrejme, zvýšená spoľahlivosť viedla k zníženiu využiteľného objemu diskov a zvýšeniu minimálneho počtu diskov: teraz, ak je v poli n diskov, celkový objem dostupný pre záznam dát sa bude rovnať objemu jeden disk vynásobený n-2. Potreba vypočítať dva kontrolné súčty naraz určuje druhú nevýhodu zdedenú RAID-6 z RAID-5 – nízku rýchlosť zápisu dát.

RAID-7 je registrovaná ochranná známka spoločnosti Storage Computer Corporation. Štruktúra poľa je nasledovná: dáta sú uložené na n-1 diskoch, jeden disk sa používa na ukladanie paritných blokov. Pridalo sa však niekoľko dôležitých detailov, aby sa odstránila hlavná nevýhoda polí tohto typu: vyrovnávacia pamäť údajov a rýchly radič, ktorý riadi spracovanie požiadaviek. To umožnilo znížiť počet prístupov na disk na výpočet kontrolného súčtu údajov. Vďaka tomu bolo možné výrazne zvýšiť rýchlosť spracovania dát (na niektorých miestach až päťkrát alebo viackrát).



Pole RAID úrovne 0+1 alebo návrh dvoch polí RAID-1 kombinovaných do RAID-0. Spoľahlivý, rýchly, drahý.

Objavili sa aj nové nevýhody: veľmi vysoké náklady na implementáciu takéhoto poľa, zložitosť jeho údržby, potreba neprerušiteľného napájania, aby sa zabránilo strate dát vo vyrovnávacej pamäti pri výpadkoch napájania. Pole tohto typu pravdepodobne neuvidíte, ale ak ho zrazu niekde uvidíte, napíšte nám, radi sa naň pozrieme.

Vytvorenie poľa

Dúfam, že sa vám už podarilo vybrať typ poľa. Ak má vaša doska radič RAID, okrem požadovaného počtu diskov a ovládačov pre tento radič nebudete potrebovať nič iné. Mimochodom, majte na pamäti: do polí má zmysel kombinovať iba disky rovnakej veľkosti, najlepšie jeden model. Ovládač môže odmietnuť pracovať s diskami rôznych veľkostí a s najväčšou pravdepodobnosťou budete môcť použiť iba časť veľkého disku, ktorý sa svojim objemom rovná menšiemu disku. Navyše, aj rýchlosť pásikového poľa bude určená rýchlosťou najpomalšieho disku. A moja rada pre vás: nesnažte sa, aby bolo pole RAID bootovateľné. Je to možné, ale ak sa v systéme vyskytnú nejaké zlyhania, budete to mať ťažké, pretože obnovenie funkčnosti bude veľmi ťažké. Okrem toho je nebezpečné umiestniť niekoľko systémov na takéto pole: takmer všetky programy zodpovedné za výber operačného systému zabíjajú informácie zo servisných oblastí pevného disku, a teda poškodzujú pole. Je lepšie zvoliť inú schému: jeden disk je zavádzací a zvyšok je spojený do poľa.



Matrix RAID v akcii. Časť miesta na disku využíva pole RAID-0, zvyšok miesta zaberá pole RAID-1.

Každé pole RAID začína systémom BIOS radiča RAID. Niekedy (iba v prípade integrovaných radičov a aj to nie vždy) je zabudovaný do hlavného BIOSu základnej dosky, niekedy je umiestnený samostatne a aktivuje sa po absolvovaní autotestu, ale v každom prípade musíte ísť tam. Práve v systéme BIOS sa nastavujú potrebné parametre poľa, ako aj veľkosti dátových blokov, použité pevné disky atď. Keď toto všetko určíte, stačí už len uložiť nastavenia, ukončiť BIOS a vrátiť sa do operačného systému.

Tam musíte nainštalovať ovládače radiča (spravidla je disketa s nimi pribalená k základnej doske alebo k samotnému ovládaču, ale dajú sa zapísať na disk s inými ovládačmi a obslužným softvérom), reštartovať a je to, pole je pripravené na použitie. Môžete ho rozdeliť na logické jednotky, naformátovať a naplniť údajmi. Nezabudnite, že RAID nie je všeliek. Zachráni vás pred stratou dát v prípade odumretia pevného disku a minimalizuje následky takéhoto výsledku, ale nezachráni vás pred prepätiami a poruchami nekvalitného zdroja napájania, ktorý zabije oba disky naraz, bez ohľadu na ich „masívnosť“.

Zanedbanie kvalitného napájania a teplotných pomerov diskov môže výrazne skrátiť životnosť HDD, stáva sa, že zlyhajú všetky disky v poli a všetky dáta sú nenávratne stratené. Najmä moderné pevné disky (najmä IBM a Hitachi) sú veľmi citlivé na +12 V kanál a nepáčia sa im ani najmenšia zmena napätia na ňom, takže pred zakúpením všetkého vybavenia potrebného na zostavenie poľa sa oplatí skontrolovať zodpovedajúce napätia a v prípade potreby zapnutie nového BP do nákupného zoznamu.

Napájanie pevných diskov, ako aj všetkých ostatných komponentov z druhého napájacieho zdroja, je na prvý pohľad jednoduché na implementáciu, ale v takejto schéme napájania je veľa úskalí a musíte premýšľať stokrát, kým sa rozhodnete použiť takýto krok. S chladením je všetko jednoduchšie: stačí zabezpečiť prúdenie vzduchu pre všetky pevné disky a navyše ich neumiestňovať blízko seba. Jednoduché pravidlá, no, žiaľ, nie každý ich dodržiava. A prípady, keď zomrú oba disky v poli súčasne, nie sú ojedinelé.

Navyše RAID nenahrádza potrebu pravidelne vytvárať zálohyúdajov. Zrkadlenie je zrkadlenie, ale ak náhodou poškodíte alebo vymažete súbory, druhý disk vám vôbec nepomôže. Takže zálohujte vždy, keď môžete. Toto pravidlo platí bez ohľadu na prítomnosť polí RAID vo vnútri počítača.

Tak čo, ste RAIDy? Áno? Skvelé! Len v snahe o objem a rýchlosť nezabudnite na ďalšie príslovie: „Nech sa modliť k Bohu, rozbije si čelo. Prajeme vám pevné disky a spoľahlivé ovládače!

Cenová výhoda hlučného RAID

RAID je dobrý aj bez ohľadu na peniaze. Poďme si však vypočítať cenu najjednoduchšieho 400 GB páskového poľa. Dva disky Seagate Barracuda SATA 7200.8 po 200 GB vás budú stáť približne 230 dolárov. Vo väčšine sú zabudované radiče RAID základné dosky, to znamená, že ich dostaneme zadarmo.

Zároveň 400 GB disk rovnakého modelu stojí 280 dolárov. Rozdiel je 50 dolárov a za tieto peniaze si môžete kúpiť výkonný zdroj, ktorý budete nepochybne potrebovať. O tom, že výkon kompozitného „disku“ za nižšiu cenu bude takmer dvakrát vyšší ako výkon jediného pevného disku, ani nehovorím.

Teraz vykonajte výpočet so zameraním na celkový objem 250 GB. Neexistujú žiadne 125 GB disky, tak si vezmime dva 120 GB pevné disky. Cena každého disku je 90 dolárov, cena jedného 250 GB pevného disku je 130 dolárov. No pri takýchto objemoch má výkon svoju cenu. Čo ak vezmeme 300 GB pole? Dva 160 GB disky - približne 200 USD, jeden 300 GB disk - 170 USD... Opäť to nie je to isté. Ukazuje sa, že RAID je výhodný iba pri použití veľmi veľkých diskov.

© Andrey Egorov, 2005, 2006. Skupina spoločností TIM.

Návštevníci fóra nám kladú otázku: „Ktorá úroveň RAID je najspoľahlivejšia? Každý vie, že najbežnejšou úrovňou je RAID5, ale nie je to bez vážnych nedostatkov, ktoré nie sú zrejmé pre neodborníkov.

RAID 0, RAID 1, RAID 5, RAID6, RAID 10 alebo aké sú úrovne RAID?

V tomto článku sa pokúsim charakterizovať najpopulárnejšie úrovne RAID a následne sformulovať odporúčania na používanie týchto úrovní. Na ilustráciu článku som vytvoril diagram, v ktorom som tieto úrovne umiestnil do trojrozmerného priestoru spoľahlivosti, výkonu a nákladovej efektívnosti.

JBOD(Just a Bunch of Disks) je jednoduché rozloženie pevných diskov, ktoré formálne nie je úrovňou RAID. Zväzok JBOD môže byť pole jedného disku alebo agregácia viacerých diskov. Radič RAID nemusí vykonávať žiadne výpočty na prevádzku takéhoto zväzku. V našom diagrame slúži disk JBOD ako „jeden“ alebo východiskový bod – jeho spoľahlivosť, výkon a náklady sú rovnaké ako pri jednom pevnom disku.

RAID 0(„pruhovanie“) nemá žiadnu redundanciu a okamžite distribuuje informácie na všetky disky v poli vo forme malých blokov („pruhy“). Z tohto dôvodu sa výkon výrazne zvyšuje, ale spoľahlivosť trpí. Rovnako ako pri JBOD, za svoje peniaze dostaneme 100% diskovej kapacity.

Dovoľte mi vysvetliť, prečo sa spoľahlivosť ukladania údajov na akomkoľvek zloženom zväzku znižuje - pretože ak niektorý z pevných diskov, ktoré sú v ňom zahrnuté, zlyhá, všetky informácie sú úplne a nenávratne stratené. V súlade s teóriou pravdepodobnosti sa matematicky spoľahlivosť zväzku RAID0 rovná súčinu spoľahlivosti jeho základných diskov, z ktorých každý je menší ako jeden, takže celková spoľahlivosť je samozrejme nižšia ako spoľahlivosť akéhokoľvek disku.

Dobrá úroveň - RAID 1(„Zrkadlenie“, „zrkadlo“). Má ochranu proti zlyhaniu polovice dostupného hardvéru (v všeobecný prípad– jeden z dvoch pevných diskov), poskytuje prijateľnú rýchlosť zápisu a zvyšuje rýchlosť čítania vďaka paralelizácii požiadaviek. Nevýhodou je, že musíte zaplatiť cenu dvoch pevných diskov, aby ste získali využiteľnú kapacitu jedného pevného disku.

Spočiatku sa predpokladá, že HDD- spoľahlivá vec. Podľa toho sa pravdepodobnosť zlyhania dvoch diskov naraz rovná (podľa vzorca) súčinu pravdepodobností, t.j. rádovo nižšie! bohužiaľ, skutočný život- to nie je teória! Dva pevné disky sa odoberajú z tej istej dávky a fungujú za rovnakých podmienok a ak jeden z diskov zlyhá, zvýši sa zaťaženie zvyšného disku, takže v praxi, ak jeden z diskov zlyhá, musia sa prijať naliehavé opatrenia na obnovenie nadbytok. Na tento účel sa odporúča použiť horúce náhradné disky s akoukoľvek úrovňou RAID (okrem nuly) HotSpare. Výhodou tohto prístupu je zachovanie konštantnej spoľahlivosti. Nevýhodou sú ešte väčšie náklady (t.j. náklady na 3 pevné disky na uloženie objemu jedného disku).

Mirror na mnohých diskoch je úroveň RAID 10. Pri použití tejto úrovne sú zrkadlené páry diskov usporiadané do „reťaze“, takže výsledný objem môže presiahnuť kapacitu jedného pevného disku. Výhody a nevýhody sú rovnaké ako pri úrovni RAID1. Rovnako ako v iných prípadoch sa odporúča zahrnúť HotSpare rezervné disky do poľa v pomere jeden náhradný na každých piatich pracovníkov.

RAID 5, skutočne najobľúbenejšia z úrovní - predovšetkým kvôli svojej účinnosti. Obetovaním kapacity iba jedného disku z poľa pre redundanciu získame ochranu pred zlyhaním ktoréhokoľvek z pevných diskov zväzku. Zápis informácií do zväzku RAID5 si vyžaduje dodatočné zdroje, pretože sú potrebné ďalšie výpočty, ale pri čítaní (v porovnaní so samostatným pevným diskom) dochádza k zisku, pretože dátové toky z niekoľkých diskových polí sú paralelizované.

Nevýhody RAID5 sa objavia, keď jeden z diskov zlyhá - celý zväzok prejde do kritického režimu, všetky operácie zápisu a čítania sú sprevádzané ďalšími manipuláciami, výkon prudko klesá a disky sa začínajú zahrievať. Ak nepodniknete okamžité kroky, môžete stratiť celý zväzok. Preto (pozri vyššie) by ste mali určite použiť Hot Spare disk so zväzkom RAID5.

Okrem základných úrovní RAID0 - RAID5 popísaných v štandarde existujú kombinované úrovne RAID10, RAID30, RAID50, RAID15, ktoré sú rôznymi výrobcami interpretované rôzne.

Podstata takýchto kombinácií je stručne nasledovná. RAID10 je kombináciou jednotky a nuly (pozri vyššie). RAID50 je kombináciou „0“ zväzkov úrovne 5. RAID15 je „zrkadlom“ „päťky“. A tak ďalej.

Kombinované úrovne teda zdedia výhody (a nevýhody) svojich „rodičov“. Takže vzhľad „nuly“ v úrovni RAID 50 nepridáva mu žiadnu spoľahlivosť, ale má pozitívny vplyv na výkon. úroveň RAID 15, pravdepodobne veľmi spoľahlivý, ale nie je najrýchlejší a navyše extrémne neekonomický (užitočná kapacita zväzku je menšia ako polovica veľkosti pôvodného diskového poľa).

RAID 6 sa líši od RAID 5 tým, že v každom riadku údajov (v angličtine prúžok) nemá jeden, ale dva blok kontrolného súčtu. Kontrolné súčty sú „viacrozmerné“, t.j. navzájom nezávislé, takže aj porucha dvoch diskov v poli umožňuje uložiť pôvodné dáta. Výpočet kontrolných súčtov metódou Reed-Solomon vyžaduje v porovnaní s RAID5 intenzívnejšie výpočty, preto sa predtým šiesta úroveň prakticky nepoužívala. Teraz je podporovaný mnohými produktmi, pretože začali inštalovať špecializované mikroobvody, ktoré vykonávajú všetky potrebné matematické operácie.

Podľa niektorých štúdií obnovenie integrity po zlyhaní jedného disku na zväzku RAID5 zloženom z SATA disky veľký objem (400 a 500 gigabajtov), ​​v 5 % prípadov to končí stratou dát. Inými slovami, v jednom prípade z dvadsiatich môže počas regenerácie RAID5 poľa na Hot Spare disk zlyhať druhý disk... Preto odporúčania najlepších RAID diskov: 1) Vždy robiť zálohy; 2) použitie RAID6!

Nedávno sa objavili nové úrovne RAID1E, RAID5E, RAID5EE. Písmeno „E“ v názve znamená Vylepšené.

Rozšírené pole RAID úrovne 1 (úroveň RAID 1E) kombinuje zrkadlenie a prekladanie údajov. Táto zmes úrovní 0 a 1 je usporiadaná nasledovne. Údaje v riadku sú distribuované presne ako v RAID 0. To znamená, že údajový riadok nemá redundanciu. Nasledujúci riadok dátových blokov kopíruje predchádzajúci s posunom o jeden blok. Tak ako v štandardnom režime RAID 1 má každý dátový blok zrkadlovú kópiu na jednom z diskov, takže užitočný objem poľa sa rovná polovici celkového objemu pevných diskov zahrnutých v poli. RAID 1E vyžaduje na fungovanie kombináciu troch alebo viacerých jednotiek.

Veľmi sa mi páči úroveň RAID1E. Pre výkonnú grafickú pracovnú stanicu alebo aj pre domáci počítač- najlepšia voľba! Má všetky výhody nultej a prvej úrovne – vynikajúcu rýchlosť a vysokú spoľahlivosť.

Prejdime teraz na úroveň Rozšírené pole RAID úrovne 5 (úroveň RAID 5E). Je to rovnaké ako RAID5, len so záložným diskom zabudovaným v poli náhradný pohon. Táto integrácia prebieha nasledovne: na všetkých diskoch poľa je ponechaná 1/N časť priestoru voľná, ktorá sa použije ako horúca náhrada v prípade zlyhania jedného z diskov. Vďaka tomu RAID5E demonštruje spolu so spoľahlivosťou, lepší výkon, keďže čítanie/zápis prebieha paralelne z väčšieho počtu diskov súčasne a náhradný disk nie je nečinný, ako v RAID5. Je zrejmé, že v tom zahrnuté zálohovací disk nemožno zdieľať s inými zväzkami (vyhradené vs. zdieľané). Zväzok RAID 5E je vytvorený na minimálne štyroch fyzických diskoch. Užitočný objem logického zväzku sa vypočíta pomocou vzorca N-2.

Rozšírený RAID level-5E (RAID level-5EE) podobný RAID level-5E, ale má efektívnejšie prideľovanie náhradných diskov a v dôsledku toho rýchlejší čas obnovy. Podobne ako úroveň RAID5E, aj táto úroveň RAID distribuuje bloky údajov a kontrolné súčty do riadkov. Ale tiež distribuuje voľné bloky náhradného disku a nerezervuje len časť miesta na disku na tieto účely. To skracuje čas potrebný na rekonštrukciu integrity zväzku RAID5EE. Záložný disk zahrnutý vo zväzku nie je možné zdieľať s inými zväzkami – ako v predchádzajúcom prípade. Zväzok RAID 5EE je vytvorený na minimálne štyroch fyzických diskoch. Užitočný objem logického zväzku sa vypočíta pomocou vzorca N-2.

Napodiv, žiadna zmienka o úrovni RAID 6E Na internete som to nenašiel - zatiaľ túto úroveň neponúka a ani neoznamuje žiadny výrobca. Úroveň RAID6E (alebo RAID6EE?) však môže byť ponúkaná podľa rovnakého princípu ako predchádzajúca. Disk HotSpare Nevyhnutne musí sprevádzať akýkoľvek zväzok RAID vrátane RAID 6. Samozrejme, nestratíme informácie, ak jeden alebo dva disky zlyhajú, ale je mimoriadne dôležité začať s regeneráciou integrity poľa čo najskôr, aby sa systém rýchlo dostal von. „kritického“ režimu. Keďže potreba Hot Spare disku je pre nás nepochybná, bolo by logické zájsť ešte ďalej a „rozložiť“ ho na zväzok, ako sa to robí v RAID 5EE, aby sme získali výhody používania väčšie množstvo disky (vyššia rýchlosť čítania a zápisu a rýchlejšie obnovenie integrity).

Úrovne RAID v „číslach“.

Niektoré dôležité parametre takmer všetkých úrovní RAID som zhromaždil do tabuľky, aby ste ich mohli navzájom porovnať a lepšie pochopiť ich podstatu.

úroveň
~~~~~~~

Chaty-
presne tak
ness
~~~~~~~

Použite
Kapacita disku
~~~~~~~

Výroba
Ditel-
ness
čítanie

~~~~~~~

Výroba
Ditel-
ness
záznamy

~~~~~~~

Vstavaný
disk
rezerva

~~~~~~~

Min. počet diskov
~~~~~~~

Max. počet diskov

~~~~~~~

Exc.

Exc.

Exc.

Exc.

Všetky úrovne „zrkadla“ sú RAID 1, 1+0, 10, 1E, 1E0.

Skúsme znova dôkladne pochopiť, ako sa tieto úrovne líšia?

RAID 1.
Toto je klasické „zrkadlo“. Dve (a len dve!) pevné disky pracovať ako jeden celok, byť úplnou kópiou jeden druhého. Zlyhanie jedného z týchto dvoch diskov nemá za následok stratu vašich údajov, pretože ovládač naďalej funguje na zostávajúcom disku. RAID1 v číslach: 2x redundancia, 2x spoľahlivosť, 2x náklady. Výkon zápisu je ekvivalentný výkonu jedného pevného disku. Výkon čítania je vyšší, pretože radič dokáže rozdeliť operácie čítania medzi dva disky.

RAID 10.
Podstatou tejto úrovne je, že disky poľa sú spojené do párov do „zrkadiel“ (RAID 1) a potom sa všetky tieto zrkadlové páry kombinujú do spoločného pruhovaného poľa (RAID 0). Preto sa niekedy označuje aj ako RAID 1+0. Dôležitý bod– RAID 10 môže kombinovať len párny počet diskov (minimálne 4, maximálne 16). Výhody: spoľahlivosť sa dedí od „zrkadla“, výkon pri čítaní aj zápise sa dedí od „nuly“.

RAID 1E.
Písmeno "E" v názve znamená "Enhanced", t.j. "vylepšený". Princíp tohto vylepšenia je nasledovný: dáta sú „ostrihané“ po blokoch naprieč všetkými diskami poľa a následne opäť „prúžkované“ s posunom na jeden disk. RAID 1E môže kombinovať od troch do 16 diskov. Spoľahlivosť zodpovedá „desiatim“ ukazovateľom a výkon je o niečo lepší vďaka väčšej „alternácii“.

RAID 1E0.
Táto úroveň je implementovaná takto: z polí RAID1E vytvoríme „null“ pole. Preto musí byť celkový počet diskov násobkom troch: minimálne tri a maximálne šesťdesiat! V tomto prípade je nepravdepodobné, že získame výhodu rýchlosti a zložitosť implementácie môže nepriaznivo ovplyvniť spoľahlivosť. Hlavnou výhodou je možnosť spojiť veľmi veľký (až 60) počet diskov do jedného poľa.

Podobnosť všetkých úrovní RAID 1X spočíva v ich indikátoroch redundancie: kvôli spoľahlivosti sa obetuje presne 50 % celkovej kapacity diskov poľa.

V závislosti od vybranej špecifikácie RAID sa môže zlepšiť rýchlosť čítania a zápisu a/alebo ochrana pred stratou údajov.

Pri práci s diskovými subsystémami sa IT špecialisti často stretávajú s dvoma hlavnými problémami.

  • Prvým je nízka rýchlosť čítania/zápisu, niekedy nestačia ani rýchlosti SSD disku.
  • Druhým je zlyhanie diskov, čo znamená stratu dát, ktorých obnovenie môže byť nemožné.

Oba tieto problémy sú riešené pomocou technológie RAID (redundantné pole nezávislých diskov - redundantné pole nezávislých diskov) - technológia virtuálne úložisko dáta, ktoré spájajú niekoľko fyzických diskov do jedného logického prvku.

V závislosti od vybranej špecifikácie RAID sa môže zlepšiť rýchlosť čítania/zápisu a/alebo ochrana pred stratou údajov.

Úrovne špecifikácií RAID sú: 1,2,3,4,5,6,0. Okrem toho existujú kombinácie: 01,10,50,05,60,06. V tomto článku sa pozrieme na najbežnejšie typy polí RAID. Najprv si však povedzme, že existujú hardvérové ​​a softvérové ​​polia RAID.

Hardvérové ​​a softvérové ​​polia RAID

  • Softvérové ​​polia sa vytvárajú po inštalácii operačného systému pomocou softvérové ​​produkty a utility, čo je hlavná nevýhoda takýchto diskových polí.
  • Hardvérové ​​RAID vytvárajú diskové pole pred inštaláciou operačného systému a nie sú na ňom závislé.

RAID 1

RAID 1 (tiež nazývaný "Mirror" - Mirror) zahŕňa úplnú duplikáciu údajov z jedného fyzického disku na druhý.

Medzi nevýhody RAID 1 patrí fakt, že získate polovičné miesto na disku. Tie. Ak použijete DVA 250 GB disky, systém uvidí iba JEDEN 250 GB veľký. Tento typ RAID neposkytuje zvýšenie rýchlosti, ale výrazne zvyšuje úroveň odolnosti voči chybám, pretože ak jeden disk zlyhá, vždy existuje jeho úplná kópia. Nahrávanie a vymazávanie z diskov prebieha súčasne. Ak boli informácie úmyselne vymazané, nebude možné ich obnoviť z iného disku.

RAID 0

RAID 0 (tiež nazývaný Striping) zahŕňa rozdelenie informácií do blokov a súčasné zapisovanie rôznych blokov na rôzne disky.

Táto technológia zvyšuje rýchlosť čítania/zápisu, umožňuje užívateľovi využiť plnú celkovú kapacitu diskov, no znižuje chybovosť, respektíve ju znižuje na nulu. Takže ak jeden z diskov zlyhá, bude takmer nemožné obnoviť informácie. Na zostavenie RAID 0 sa odporúča používať iba vysoko spoľahlivé disky.

RAID 5 možno nazvať pokročilejším RAID 0. Môžete použiť až 3 pevné disky. Raid 0 je zaznamenaný na všetkých okrem jedného a na poslednom je zaznamenaný špeciálny kontrolný súčet, ktorý vám umožňuje ukladať informácie na pevné disky v prípade „smrti“ jedného z nich (ale nie viac ako jedného). Prevádzková rýchlosť takéhoto poľa je vysoká. Ak vymeníte disk, zaberie to veľa času.

RAID 2, 3, 4

Ide o metódy distribuovaného ukladania informácií pomocou diskov pridelených pre paritné kódy. Líšia sa od seba iba veľkosťou blokov. V praxi sa prakticky nepoužívajú z dôvodu potreby venovať veľkú časť diskovej kapacity ukladaniu ECC a/alebo paritných kódov, ako aj z dôvodu nízkeho výkonu.

RAID 10

Ide o kombináciu polí RAID 1 a 0. A kombinuje výhody každého z nich: vysoký výkon a vysokú odolnosť voči chybám.

Pole musí obsahovať párny počet diskov (minimálne 4) a je najspoľahlivejšou možnosťou na ukladanie informácií. Nevýhodou je vysoká cena diskového poľa: efektívna kapacita bude polovica celkovej kapacity diskového priestoru.

Ide o kombináciu polí RAID 5 a 0. RAID 5 sa buduje, ale jeho komponenty nebudú nezávislé pevné disky a polia RAID 0.

Zvláštnosti.

Ak sa pokazí radič RAID, je takmer nemožné obnoviť informácie (neplatí pre Mirror). Aj keď si kúpite presne ten istý radič, existuje vysoká pravdepodobnosť, že RAID bude zostavený z iných sektorov disku, čo znamená, že informácie na diskoch sa stratia.

Disky sa spravidla nakupujú v jednej dávke. Podľa toho môže byť ich životnosť približne rovnaká. V takom prípade sa odporúča okamžite, v čase nákupu diskov pre pole, zakúpiť nejaký prebytok. Ak chcete napríklad nakonfigurovať RAID 10 zo 4 diskov, mali by ste si kúpiť 5 diskov. Ak teda jeden z nich zlyhá, môžete ho rýchlo vymeniť za nový skôr, ako zlyhajú ostatné disky.

Závery.

V praxi sa najčastejšie používajú len tri typy RAID polí. Sú to RAID 1, RAID 10 a RAID 5.

Z hľadiska ceny/výkonu/odolnosti voči chybám sa odporúča použiť:

  • RAID 1(zrkadlenie) na vytvorenie diskového subsystému pre používateľské operačné systémy.
  • RAID 10 pre dáta s vysokými požiadavkami na rýchlosť zápisu a čítania. Napríklad na ukladanie databáz 1C:Enterprise, poštový server, A.D.
  • RAID 5 slúži na ukladanie dát súboru.

Ideálne serverové riešenie podľa väčšiny správcov systému je server so šiestimi diskami. Dva disky sú „zrkadlené“ a operačný systém je nainštalovaný na RAID 1. Štyri zostávajúce disky sú spojené do RAID 10 pre rýchlu, bezproblémovú a spoľahlivú prevádzku systému.

Ak vás tento článok zaujal, pravdepodobne ste na svojom počítači narazili alebo očakávate, že čoskoro narazíte na niektorý z nasledujúcich problémov:

- očividne nie je dostatočná fyzická kapacita pevného disku ako jedného logického disku. Najčastejšie sa tento problém vyskytuje pri práci s veľkými súbormi (video, grafika, databázy);
- výkon pevného disku zjavne nestačí. Najčastejšie sa tento problém vyskytuje pri práci s nelineárnymi systémami na úpravu videa alebo keď veľký počet používateľov súčasne pristupuje k súborom na pevnom disku;
- Spoľahlivosť pevného disku jednoznačne chýba. Najčastejšie tento problém nastáva vtedy, keď je potrebné pracovať s dátami, ktoré sa nikdy nesmú stratiť alebo ktoré musia byť užívateľovi vždy dostupné. Smutná skúsenosť ukazuje, že aj to najspoľahlivejšie zariadenie sa niekedy pokazí a spravidla v tú najnevhodnejšiu chvíľu.
Vytvorenie systému RAID na vašom počítači môže vyriešiť tieto a niektoré ďalšie problémy.

Čo je to "RAID"?

V roku 1987 Patterson, Gibson a Katz z Kalifornskej univerzity v Berkeley publikovali „A Case for Redundant Arrays of Inexpensive Disks (RAID). Tento článok je popísaný odlišné typy diskové polia, označované skratkou RAID - Redundant Array of Independent (alebo Inexpensive) Disks (redundantné pole nezávislých (alebo lacných) diskových jednotiek). RAID je založený na nasledujúcej myšlienke: spojením niekoľkých malých a/alebo lacných diskových jednotiek do poľa môžete získať systém, ktorý je lepší svojou kapacitou, rýchlosťou a spoľahlivosťou ako najdrahšie diskové jednotky. Navyše, z pohľadu počítača vyzerá takýto systém ako jedna disková jednotka.
Je známe, že stredný čas medzi poruchami poľa diskov sa rovná strednému času medzi poruchami jedného disku vydelenému počtom diskov v poli. V dôsledku toho je stredný čas medzi poruchami poľa príliš krátky pre mnohé aplikácie. Diskové pole však môže byť tolerantné voči zlyhaniu jedného disku niekoľkými spôsobmi.

Vo vyššie uvedenom článku bolo definovaných päť typov (úrovní) diskových polí: RAID-1, RAID-2, ..., RAID-5. Každý typ poskytoval odolnosť voči chybám, ako aj rôzne výhody oproti jednému disku. Spolu s týmito piatimi typmi si obľubu získalo aj diskové pole RAID-0, ktoré NIE JE redundantné.

Aké úrovne RAID existujú a ktorý z nich by ste si mali vybrať?

RAID-0. Zvyčajne sa definuje ako neredundantná skupina diskových jednotiek bez parity. RAID-0 sa niekedy nazýva „striping“ na základe spôsobu, akým sú informácie umiestnené na diskoch zahrnutých v poli:

Keďže RAID-0 nemá redundanciu, zlyhanie jedného disku vedie k zlyhaniu celého poľa. Na druhej strane RAID-0 poskytuje maximálnu rýchlosť prenosu dát a efektívne využitie miesta na disku. Pretože RAID-0 nevyžaduje zložité matematické ani logické výpočty, náklady na jeho implementáciu sú minimálne.

Rozsah použitia: audio a video aplikácie vyžadujúce vysokorýchlostný nepretržitý prenos dát, ktorý nemôže zabezpečiť jeden disk. Napríklad výskum uskutočnený spoločnosťou Mylex na určenie optimálnej konfigurácie diskového systému pre nelineárnu stanicu na úpravu videa ukazuje, že v porovnaní s jednou diskovou jednotkou pole RAID-0 s dvoma diskovými jednotkami poskytuje 96 % nárast zápisu/čítania. rýchlosť, z troch diskových jednotiek - o 143 % (podľa testu Miro VIDEO EXPERT Benchmark).
Minimálny počet jednotiek v poli „RAID-0“ sú 2.

RAID-1. Známejšie ako „zrkadlenie“ je pár jednotiek, ktoré obsahujú rovnaké informácie a tvoria jednu logickú jednotku:

Nahrávanie sa vykonáva na oboch diskoch v každom páre. Jednotky v páre však môžu vykonávať simultánne operácie čítania. „Zrkadlenie“ teda dokáže zdvojnásobiť rýchlosť čítania, no rýchlosť zápisu zostáva nezmenená. RAID-1 má 100% redundanciu a porucha jedného disku nevedie k poruche celého poľa – radič jednoducho prepne operácie čítania/zápisu na zostávajúci disk.
RAID-1 poskytuje najvyššiu rýchlosť zo všetkých typov redundantných polí (RAID-1 – RAID-5), najmä vo viacužívateľskom prostredí, no najhoršie využitie miesta na disku. Pretože RAID-1 nevyžaduje zložité matematické ani logické výpočty, náklady na jeho implementáciu sú minimálne.
Minimálny počet jednotiek v poli „RAID-1“ sú 2.
Na zvýšenie rýchlosti zápisu a zabezpečenie spoľahlivého ukladania dát je možné niekoľko polí RAID-1 skombinovať do RAID-0. Táto konfigurácia sa nazýva „dvojúrovňový“ RAID alebo RAID-10 (RAID 0+1):


Minimálny počet jednotiek v poli „RAID 0+1“ sú 4.
Rozsah použitia: lacné polia, v ktorých hlavnou vecou je spoľahlivosť ukladania údajov.

RAID-2. Rozdeľuje údaje do pruhov o veľkosti sektora v skupine diskových jednotiek. Niektoré jednotky sú vyhradené na ukladanie ECC (Error Correction Code). Keďže väčšina diskov štandardne ukladá kódy ECC podľa sektorov, RAID-2 neponúka veľa výhod oproti RAID-3, a preto sa v praxi nepoužíva.

RAID-3. Rovnako ako v prípade RAID-2 sú dáta distribuované cez pruhy s veľkosťou jedného sektora a jedna z jednotiek poľa je pridelená na ukladanie informácií o parite:

RAID-3 sa pri zisťovaní chýb spolieha na kódy ECC uložené v každom sektore. Ak jeden z diskov zlyhá, informácie na ňom uložené možno obnoviť výpočtom exkluzívneho OR (XOR) pomocou informácií o zostávajúcich diskoch. Každý záznam je zvyčajne distribuovaný na všetkých diskoch, a preto je tento typ poľa vhodný pre aplikácie náročné na disk. Pretože každá I/O operácia sprístupňuje všetky diskové jednotky v poli, RAID-3 nemôže vykonávať viacero operácií súčasne. Preto je RAID-3 vhodný pre prostredia s jedným používateľom s jednou úlohou s dlhými záznamami. Pracovať s krátke poznámky je potrebná synchronizácia otáčania diskových jednotiek, pretože inak je nevyhnutné zníženie rýchlosti výmeny. Málo používané, pretože horší ako RAID-5, pokiaľ ide o využitie miesta na disku. Implementácia si vyžaduje značné náklady.
Minimálny počet jednotiek v poli „RAID-3“ sú 3.

RAID-4. RAID-4 je identický s RAID-3 okrem toho, že veľkosť pruhu je oveľa väčšia ako jeden sektor. V tomto prípade sa čítania vykonávajú z jednej jednotky (nepočítajúc jednotku, na ktorej sú uložené informácie o parite), takže je možné vykonať viacero operácií čítania súčasne. Keďže však každá operácia zápisu musí aktualizovať obsah paritnej jednotky, nie je možné vykonávať viacero operácií zápisu súčasne. Tento typ poľa nemá žiadne viditeľné výhody oproti poli RAID-5.
RAID-5. Tento typ poľa sa niekedy nazýva "rotujúce paritné pole". Tento typ poľa úspešne prekonáva inherentnú nevýhodu RAID-4 - nemožnosť súčasne vykonávať niekoľko operácií zápisu. Toto pole, podobne ako RAID-4, používa pruhy veľké, ale na rozdiel od RAID-4 sa informácie o parite neukladajú na jeden disk, ale postupne na všetky disky:

Operácie zápisu pristupujú k jednej jednotke s údajmi a druhej jednotke s informáciami o parite. Keďže informácie o parite pre rôzne pruhy sú uložené na rôznych jednotkách, nie je možný viacnásobný súčasný zápis, pokiaľ nie sú pruhy údajov alebo pruhy parity na rovnakej jednotke. Čím viac jednotiek v poli, tým menej často sa zhoduje umiestnenie informačných a paritných pruhov.
Rozsah použitia: spoľahlivé veľkoobjemové polia. Implementácia si vyžaduje značné náklady.
Minimálny počet jednotiek v poli „RAID-5“ sú 3.

RAID-1 alebo RAID-5?
RAID-5 využíva ekonomickejšie ako RAID-1 miesto na disku, keďže z dôvodu nadbytočnosti neukladá „kópiu“ informácií, ale kontrolné číslo. Výsledkom je, že RAID-5 môže kombinovať ľubovoľný počet diskov, z ktorých iba jeden bude obsahovať nadbytočné informácie.
Vyššia efektivita miesta na disku však prichádza na úkor nižších výmenných kurzov informácií. Pri zapisovaní informácií do RAID-5 sa musia informácie o parite zakaždým aktualizovať. Aby ste to dosiahli, musíte určiť, ktoré paritné bity sa zmenili. Najprv sa prečítajú staré informácie, ktoré sa majú aktualizovať. Tieto informácie sa potom XORujú nové informácie. Výsledkom tejto operácie je bitová maska, v ktorej každý bit =1 znamená, že hodnotu v paritnej informácii na zodpovedajúcej pozícii treba nahradiť. Aktualizované informácie o parite sa potom zapíšu na príslušné miesto. Preto pri každej programovej požiadavke na zápis informácií RAID-5 vykoná dve čítania, dva zápisy a dve operácie XOR.
Efektívnejšie využitie miesta na disku je nákladné (ukladanie paritného bloku namiesto kópie údajov): generovanie a zápis paritných informácií si vyžaduje dodatočný čas. To znamená, že rýchlosť zápisu na RAID-5 je nižšia ako na RAID-1 v pomere 3:5 alebo dokonca 1:3 (t. j. rýchlosť zápisu na RAID-5 je 3/5 až 1/3 rýchlosti zápisu RAID-1). Z tohto dôvodu je RAID-5 zbytočné vytvárať softvérovo. Tiež ich nemožno odporučiť v prípadoch, keď je rýchlosť nahrávania kritická.

Ktorú metódu implementácie RAID by ste si mali vybrať - softvér alebo hardvér?

Po prečítaní popisov rôznych úrovní RAID si všimnete, že nikde nie je zmienka o žiadnych špecifických hardvérových požiadavkách, ktoré sú potrebné na implementáciu RAID. Z čoho môžeme vyvodiť záver, že na implementáciu RAID je potrebné iba pripojiť požadovaný počet diskových jednotiek k radiču dostupnému v počítači a nainštalovať do počítača špeciálny softvér. To je pravda, ale nie úplne!
V skutočnosti je možné implementovať RAID v softvéri. Príkladom môže byť OS Microsoft Windows NT 4.0 Server, v ktorom je možná softvérová implementácia RAID-0, -1 a dokonca RAID-5 (Microsoft Windows NT 4.0 Workstation poskytuje iba RAID-0 a RAID-1). Toto riešenie však treba považovať za extrémne zjednodušené a neumožňuje plne využiť možnosti poľa RAID. Stačí poznamenať, že so softvérovou implementáciou RAID sa celá záťaž umiestňovania informácií na diskové jednotky, výpočet riadiacich kódov atď. padá na CPU, čo prirodzene nezvyšuje výkon a spoľahlivosť systému. Z rovnakých dôvodov tu prakticky neexistujú žiadne servisné funkcie a všetky operácie na výmenu chybného disku, pridanie nového disku, zmenu úrovne RAID atď. sa vykonávajú s úplnou stratou dát a s úplným zákazom vykonávania akýchkoľvek iných operácií. Jedinou výhodou softvérovej implementácie RAID je jeho minimálna cena.
- špecializovaný radič oslobodzuje centrálny procesor od základných operácií RAID a účinnosť radiča je tým výraznejšia, čím vyššia je úroveň zložitosti RAID;
- radiče sú spravidla vybavené ovládačmi, ktoré vám umožňujú vytvárať RAID pre takmer akýkoľvek populárny operačný systém;
- vstavaný BIOS radiča a k nemu pribalené programy na správu umožňujú správcovi systému jednoducho pripájať, odpájať alebo vymieňať disky zahrnuté v RAID, vytvárať viaceré polia RAID, dokonca na rôznych úrovniach, sledovať stav diskového poľa, atď. S „pokročilými“ ovládačmi je možné tieto operácie vykonávať „za behu“, t.j. bez vypnutia systémová jednotka. Mnoho operácií je možné vykonať v " pozadie“, t.j. bez prerušenia aktuálnej práce a aj na diaľku, t.j. z akéhokoľvek (samozrejme, ak máte prístup) pracoviska;
- možno vybaviť ovládačmi vyrovnávacia pamäť(„cache“), v ktorej je uložených niekoľko posledných blokov údajov, ktoré pri častom prístupe k rovnakým súborom môžu výrazne zvýšiť výkon diskového systému.
Nevýhodou hardvérovej implementácie RAID je relatívne vysoká cena RAID radičov. Na jednej strane však musíte za všetko zaplatiť (spoľahlivosť, rýchlosť, servis). Na druhej strane, v poslednom čase s rozvojom mikroprocesorovej technológie cena RAID radičov (najmä mladších modelov) začala prudko klesať a stala sa porovnateľnou s cenou bežných diskových radičov, čo umožňuje inštalovať RAID systémy nielen v drahých sálových počítačoch, ale aj na serveroch vstupný level a dokonca aj na pracovné stanice.

Ako si vybrať model radiča RAID?

Existuje niekoľko typov radičov RAID v závislosti od ich funkčnosti, dizajnu a ceny:
1. Radiče diskov s funkciou RAID.
V podstate ide o obyčajný diskový radič, ktorý vďaka špeciálnemu firmvéru BIOS umožňuje kombinovať diskové mechaniky do poľa RAID zvyčajne úrovne 0, 1 alebo 0+1.

Ultra (Ultra Wide) SCSI radič od Mylex KT930RF (KT950RF).
Vonkajšie tento ovládač sa nelíši od bežného SCSI radiča. Celá „špecializácia“ sa nachádza v systéme BIOS, ktorý je rozdelený na dve časti - „Konfigurácia SCSI“ / „Konfigurácia RAID“. Napriek nízkej cene (menej ako 200 USD) má tento ovládač dobrú sadu funkcií:

- kombinovanie až 8 diskov do RAID 0, 1 alebo 0+1;
- podpora Horúci náhradný diel na výmenu chybnej diskovej jednotky za chodu;
- schopnosť automaticky (bez zásahu obsluhy) vymeniť chybný pohon;
- automatická kontrola integrity a identity dát (pre RAID-1);
- prítomnosť hesla na prístup do systému BIOS;
- program RAIDplus, ktorý poskytuje informácie o stave diskov v RAID;
- ovládače pre DOS, Windows 95, NT 3.5x, 4.0