Co je raidové pole - typy a nastavení. Pole RAID – spolehlivost a výkon Co znamená raid 0?

Pokud vás tento článek zaujal, pravděpodobně jste se ve svém počítači setkali nebo očekáváte, že se brzy setkáte s některým z následujících problémů:

- zjevně není dostatečná fyzická kapacita pevného disku jako samostatného logického disku. Nejčastěji se tento problém vyskytuje při práci s velkými soubory (video, grafika, databáze);
- výkon pevného disku zjevně nestačí. Nejčastěji se tento problém vyskytuje při práci s nelineárními systémy pro úpravu videa nebo když velký počet uživatelů současně přistupuje k souborům na pevném disku;
- Spolehlivost pevného disku zjevně chybí. Nejčastěji tento problém nastává, když je potřeba pracovat s daty, která se nikdy nesmí ztratit nebo která musí být uživateli vždy k dispozici. Smutná zkušenost ukazuje, že i to nejspolehlivější zařízení se někdy porouchá a zpravidla v tu nejméně vhodnou chvíli.
Tyto a některé další problémy může vyřešit vytvoření systému RAID v počítači.

Co je to "RAID"?

V roce 1987 publikovali Patterson, Gibson a Katz z Kalifornské univerzity v Berkeley „A Case for Redundant Arrays of Inexpensive Disks (RAID). Tento článek popisoval různé typy diskových polí, označovaných zkratkou RAID - Redundant Array of Independent (nebo Inexpensive) Disks (redundantní pole nezávislých (nebo levných) diskových jednotek). RAID je založen na následující myšlence: spojením několika malých a/nebo levných diskových jednotek do pole můžete získat systém, který převyšuje kapacitu, rychlost a spolehlivost nejdražších diskových jednotek. Navíc z pohledu počítače takový systém vypadá jako jeden jediný disk.
Je známo, že střední doba mezi poruchami pole pohonů se rovná střední době mezi poruchami jednoho pohonu dělené počtem pohonů v poli. V důsledku toho je střední doba mezi poruchami pole pro mnoho aplikací příliš krátká. Diskové pole však může být tolerantní vůči selhání jednoho disku několika způsoby.

Ve výše uvedeném článku bylo definováno pět typů (úrovní) diskových polí: RAID-1, RAID-2, ..., RAID-5. Každý typ poskytoval odolnost proti chybám a také různé výhody oproti jedinému disku. Spolu s těmito pěti typy si oblibu získalo i diskové pole RAID-0, které NENÍ redundantní.

Jaké úrovně RAID existují a kterou byste si měli vybrat?

RAID-0. Obvykle se definuje jako neredundantní skupina diskových jednotek bez parity. RAID-0 se někdy nazývá „prokládání“ na základě způsobu umístění informací na jednotkách obsažených v poli:

Protože RAID-0 nemá redundanci, selhání jednoho disku vede k selhání celého pole. Na druhou stranu RAID-0 poskytuje maximální rychlost přenosu dat a efektivní využití místa na disku. Protože RAID-0 nevyžaduje složité matematické nebo logické výpočty, jsou náklady na jeho implementaci minimální.

Rozsah použití: audio a video aplikace vyžadující vysokorychlostní nepřetržitý přenos dat, který nemůže zajistit jeden disk. Například výzkum provedený společností Mylex s cílem určit optimální konfiguraci diskového systému pro nelineární stanici pro úpravu videa ukazuje, že ve srovnání s jednou diskovou jednotkou pole RAID-0 se dvěma diskovými jednotkami poskytuje 96% nárůst zápisu/čtení. rychlost, ze tří diskových jednotek - o 143 % (podle testu Miro VIDEO EXPERT Benchmark).
Minimální počet jednotek v poli „RAID-0“ jsou 2.

RAID-1. Více známý jako "Mirroring" je dvojice jednotek, které obsahují stejné informace a tvoří jednu logickou jednotku:

Záznam se provádí na obou jednotkách v každém páru. Jednotky v páru však mohou provádět simultánní operace čtení. „Zrcadlení“ tedy může zdvojnásobit rychlost čtení, ale rychlost zápisu zůstává nezměněna. RAID-1 má 100% redundanci a porucha jednoho disku nevede k poruše celého pole – řadič jednoduše přepne operace čtení/zápisu na zbývající disk.
RAID-1 poskytuje nejvyšší rychlost ze všech typů redundantních polí (RAID-1 - RAID-5), zejména ve víceuživatelském prostředí, ale nejhorší využití místa na disku. Protože RAID-1 nevyžaduje složité matematické ani logické výpočty, jsou náklady na jeho implementaci minimální.
Minimální počet jednotek v poli „RAID-1“ jsou 2.
Pro zvýšení rychlosti zápisu a zajištění spolehlivosti datového úložiště lze několik polí RAID-1 zkombinovat do RAID-0. Tato konfigurace se nazývá „dvouúrovňový“ RAID nebo RAID-10 (RAID 0+1):


Minimální počet jednotek v poli „RAID 0+1“ jsou 4.
Rozsah použití: levná pole, ve kterých je hlavní věcí spolehlivost ukládání dat.

RAID-2. Distribuuje data do pruhů o velikosti sektoru přes skupinu diskových jednotek. Některé disky jsou vyhrazeny pro úložiště ECC (Error Correction Code). Protože většina disků ve výchozím nastavení ukládá kódy ECC pro jednotlivé sektory, nenabízí RAID-2 mnoho výhod oproti RAID-3, a proto se v praxi nepoužívá.

RAID-3. Stejně jako v případě RAID-2 jsou data distribuována do pruhů o velikosti jednoho sektoru a jeden z disků pole je přidělen k ukládání informací o paritě:

RAID-3 se při zjišťování chyb spoléhá na kódy ECC uložené v každém sektoru. Pokud jeden z disků selže, informace na něm uložené lze obnovit výpočtem exkluzivního OR (XOR) pomocí informací o zbývajících jednotkách. Každý záznam je obvykle distribuován na všech jednotkách, a proto je tento typ pole vhodný pro aplikace náročné na disk. Protože každá I/O operace přistupuje ke všem diskovým jednotkám v poli, RAID-3 nemůže provádět více operací současně. Proto je pole RAID-3 vhodné pro prostředí s jedním uživatelem a jediným úkolem s dlouhými záznamy. Pro práci s krátkými záznamy je nutné synchronizovat otáčení diskových jednotek, protože jinak je nevyhnutelný pokles rychlosti výměny. Málo používaný, protože horší než RAID-5, pokud jde o využití místa na disku. Implementace vyžaduje značné náklady.
Minimální počet jednotek v poli „RAID-3“ jsou 3.

RAID-4. RAID-4 je identický s RAID-3 kromě toho, že velikost pruhu je mnohem větší než jeden sektor. V tomto případě jsou čtení prováděna z jedné jednotky (nepočítáme jednotku, která uchovává informace o paritě), takže lze provádět více operací čtení současně. Protože však každá operace zápisu musí aktualizovat obsah paritní jednotky, není možné provádět více operací zápisu současně. Tento typ pole nemá žádné výrazné výhody oproti poli RAID-5.
RAID-5. Tento typ pole se někdy nazývá „rotující paritní pole“. Tento typ pole úspěšně překonává inherentní nevýhodu RAID-4 – nemožnost současně provádět více operací zápisu. Toto pole, stejně jako RAID-4, používá pruhy velké, ale na rozdíl od RAID-4 nejsou informace o paritě uloženy na jednom disku, ale postupně na všech jednotkách:

Operace zápisu zpřístupňují jeden disk s daty a druhý disk s informacemi o paritě. Protože paritní informace pro různé pruhy jsou uloženy na různých jednotkách, není možný více současných zápisů, pokud se datový pruh nebo pruh parity nenachází na stejné jednotce. Čím více jednotek v poli, tím méně často se umístění informačních a paritních pruhů shoduje.
Rozsah použití: spolehlivá velkoobjemová pole. Implementace vyžaduje značné náklady.
Minimální počet jednotek v poli „RAID-5“ jsou 3.

RAID-1 nebo RAID-5?
RAID-5 ve srovnání s RAID-1 využívá místo na disku ekonomičtěji, protože z důvodu redundance neukládá „kopii“ informací, ale kontrolní číslo. Díky tomu může RAID-5 kombinovat libovolný počet disků, z nichž pouze jeden bude obsahovat redundantní informace.
Vyšší efektivita místa na disku však přichází na úkor nižších směnných kurzů informací. Při zápisu informací do pole RAID-5 je nutné informace o paritě pokaždé aktualizovat. Chcete-li to provést, musíte určit, které paritní bity se změnily. Nejprve se přečtou staré informace, které mají být aktualizovány. Tyto informace jsou pak XORed s novými informacemi. Výsledkem této operace je bitová maska, ve které každý bit =1 znamená, že hodnota v paritní informaci na odpovídající pozici musí být nahrazena. Aktualizované informace o paritě jsou pak zapsány do příslušného umístění. Proto pro každý požadavek programu na zápis informací RAID-5 provede dvě čtení, dva zápisy a dvě operace XOR.
Efektivnější využití místa na disku (ukládání paritního bloku místo kopie dat) stojí náklady: generování a zápis paritních informací je zapotřebí navíc. To znamená, že rychlost zápisu na RAID-5 je nižší než na RAID-1 v poměru 3:5 nebo dokonce 1:3 (tj. rychlost zápisu na RAID-5 je 3/5 až 1/3 rychlosti zápisu RAID-1). Z tohoto důvodu nemá smysl RAID-5 vytvářet softwarově. Rovněž je nelze doporučit v případech, kdy je rychlost záznamu kritická.

Jakou metodu implementace RAID byste si měli vybrat – softwarovou nebo hardwarovou?

Po přečtení popisů různých úrovní RAID si všimnete, že nikde není zmínka o nějakých specifických hardwarových požadavcích, které jsou potřeba k implementaci RAID. Z čehož můžeme usoudit, že k implementaci RAID stačí pouze připojit požadovaný počet diskových jednotek k řadiči dostupnému v počítači a nainstalovat do počítače speciální software. To je pravda, ale ne úplně!
RAID je skutečně možné implementovat softwarově. Příkladem je operační systém Microsoft Windows NT 4.0 Server, ve kterém je možná softwarová implementace RAID-0, -1 a dokonce RAID-5 (Microsoft Windows NT 4.0 Workstation poskytuje pouze RAID-0 a RAID-1). Toto řešení je však třeba považovat za extrémně zjednodušené a neumožňuje plně realizovat možnosti pole RAID. Stačí poznamenat, že se softwarovou implementací RAID je celá zátěž umístěním informací na diskové jednotky, výpočty řídicích kódů atd. padá na centrální procesor, což přirozeně nezvyšuje výkon a spolehlivost systému. Ze stejných důvodů zde prakticky neexistují žádné servisní funkce a veškeré operace pro výměnu vadného disku, přidání nového disku, změnu úrovně RAID atd. jsou prováděny s úplnou ztrátou dat a s úplným zákazem provádění jakýchkoli jiných operace. Jedinou výhodou softwarové implementace RAID je jeho minimální cena.
- specializovaný řadič osvobozuje centrální procesor od základních operací RAID a účinnost řadiče je tím patrnější, čím vyšší je úroveň složitosti RAID;
- řadiče jsou zpravidla vybaveny ovladači, které vám umožňují vytvářet pole RAID pro téměř jakýkoli populární operační systém;
- vestavěný BIOS řadiče a s ním obsažené programy pro správu umožňují správci systému snadno připojit, odpojit nebo vyměnit disky zahrnuté v RAID, vytvořit několik polí RAID, a to i na různých úrovních, sledovat stav diskového pole, atd. S „pokročilými“ ovladači lze tyto operace provádět „za běhu“, tzn. bez vypnutí systémové jednotky. Mnoho operací lze provádět na „pozadí“, tzn. bez přerušení aktuální práce a to i na dálku, tzn. z jakéhokoli (samozřejmě, pokud máte přístup) pracoviště;
- řadiče mohou být vybaveny vyrovnávací pamětí („cache“), ve které je uloženo několik posledních bloků dat, což při častém přístupu ke stejným souborům může výrazně zvýšit výkon diskového systému.
Nevýhodou hardwarové implementace RAID je relativně vysoká cena RAID řadičů. Na jednu stranu však musíte za vše zaplatit (spolehlivost, rychlost, obsluha). Na druhou stranu v poslední době s rozvojem mikroprocesorové technologie začala cena RAID řadičů (zejména mladších modelů) prudce klesat a stala se srovnatelnou s cenou běžných diskových řadičů, což umožňuje instalovat RAID systémy nejen v drahé sálové počítače, ale také na serverech základní úrovně a dokonce i na pracovních stanicích.

Jak vybrat model řadiče RAID?

Existuje několik typů řadičů RAID v závislosti na jejich funkčnosti, designu a ceně:
1. Řadiče disků s funkcí RAID.
V podstatě se jedná o obyčejný diskový řadič, který díky speciálnímu firmware BIOSu umožňuje spojovat diskové mechaniky do RAID pole obvykle úrovně 0, 1 nebo 0+1.

Ultra (Ultra Wide) SCSI řadič od Mylex KT930RF (KT950RF).
Externě se tento řadič neliší od běžného SCSI řadiče. Veškerá „specializace“ se nachází v systému BIOS, který je rozdělen na dvě části – „Konfigurace SCSI“ / „Konfigurace RAID“. Navzdory své nízké ceně (méně než 200 $) má tento ovladač dobrou sadu funkcí:

- kombinace až 8 disků do RAID 0, 1 nebo 0+1;
- podpora Hot náhradní pro výměnu vadné diskové jednotky za běhu;
- schopnost automaticky (bez zásahu obsluhy) vyměnit vadný pohon;
- automatická kontrola integrity a identity dat (pro RAID-1);
- přítomnost hesla pro přístup do systému BIOS;
- program RAIDplus, který poskytuje informace o stavu disků v RAID;
- ovladače pro DOS, Windows 95, NT 3.5x, 4.0

Problém zvýšení spolehlivosti ukládání informací a současného zvýšení výkonu systému pro ukládání dat je v hlavě vývojářů počítačových periferií již dlouhou dobu. Pokud jde o zvyšování spolehlivosti úložiště, je vše jasné: informace jsou zboží a často velmi cenné. K ochraně před ztrátou dat bylo vynalezeno mnoho metod, z nichž nejznámější a nejspolehlivější je zálohování informací.

Problematika zvýšení výkonu diskového subsystému je velmi složitá. Růst výpočetního výkonu moderních procesorů vedl k jasné nerovnováze mezi možnostmi pevných disků a potřebami procesorů. Zachránit vás přitom nemohou ani drahé disky SCSI a tím spíše disky IDE. Pokud však možnosti jednoho disku nestačí, možná tento problém částečně vyřeší několik disků? Pouhá přítomnost dvou nebo více pevných disků v počítači nebo serveru na věci samozřejmě nic nemění – je třeba zajistit, aby tyto disky spolupracovaly (paralelně) mezi sebou, aby se tím zlepšil výkon diskového subsystému na operace zápisu/čtení. Je navíc možné použitím několika pevných disků zlepšit nejen výkon, ale i spolehlivost ukládání dat, aby porucha jednoho z disků nevedla ke ztrátě informací? To je přesně ten přístup, který v roce 1987 navrhli američtí vědci Patterson, Gibson a Katz z University of California v Berkeley. Ve svém článku „A Case for Redundant Arrays of Inexpensive Discs, RAID“ popsali, jak lze spojit více levných pevných disků do jediného logického zařízení, což má za následek zvýšení kapacity a výkonu systému a selhání jednotlivých disků by nemělo být vést k selhání celého systému.

Od vydání článku uplynulo 15 let, ale technologie budování RAID polí neztratila ani dnes na aktuálnosti. Jediné, co se od té doby změnilo, je dekódování zkratky RAID. Faktem je, že zpočátku RAID pole nebyla vůbec stavěna na levné disky, a tak se slovo Inexpensive (levný) změnilo na Independent (nezávislý), což platilo spíše.

Navíc je to nyní, kdy se technologie RAID rozšířila.

Pokud se tedy před několika lety pole RAID používalo na drahých serverech podnikové úrovně využívajících disky SCSI, dnes se stala jakýmsi de facto standardem i pro servery základní úrovně. Kromě toho se postupně rozšiřuje trh s IDE RAID řadiči, to znamená, že úkol vybudovat RAID pole na pracovních stanicích pomocí levných IDE disků se stává naléhavým. Někteří výrobci základních desek (Abit, Gigabyte) tedy již začali integrovat IDE RAID řadiče na samotné desky.

RAID je tedy redundantní pole nezávislých disků (Redundant Arrays of Independent Discs), jehož úkolem je zajistit odolnost proti chybám a zvýšit výkon. Tolerance chyb je dosažena redundancí. To znamená, že část diskové kapacity je přidělena pro oficiální účely a stává se pro uživatele nedostupnou.

Zvýšený výkon diskového subsystému je zajištěn současným provozem více disků a v tomto smyslu platí, že čím více disků v poli (do určité hranice), tím lépe.

Společný provoz disků v poli může být organizován pomocí paralelního nebo nezávislého přístupu.

Je třeba poznamenat, že model paralelního přístupu je implementován pouze v případě, že velikost požadavku na zápis dat je větší než velikost samotného bloku. Jinak je prostě nemožné implementovat paralelní záznam několika bloků.

Představme si situaci, kdy velikost jednotlivého bloku je 8 KB a velikost požadavku na zápis dat je 64 KB. V tomto případě jsou původní informace rozřezány na osm bloků po 8 KB. Pokud máte pole se čtyřmi disky, můžete najednou zapisovat čtyři bloky nebo 32 kB. Je zřejmé, že v uvažovaném příkladu bude rychlost zápisu a čtení čtyřikrát vyšší než při použití jednoho disku. Tato situace je však ideální, protože velikost požadavku není vždy násobkem velikosti bloku a počtu disků v poli.

Pokud je velikost zaznamenaných dat menší než velikost bloku, pak je implementován zásadně odlišný model přístupu - nezávislý přístup. Navíc lze tento model implementovat i v případě, kdy je velikost zaznamenaných dat větší než velikost jednoho bloku. Při nezávislém přístupu jsou všechna data z jednoho požadavku zapsána na samostatný disk, to znamená, že situace je stejná jako při práci s jedním diskem. Výhodou modelu paralelního přístupu je, že pokud přijde několik požadavků na zápis (čtení) současně, budou všechny provedeny nezávisle na samostatných discích (obr. 3). Podobná situace je typická například u serverů.

V souladu s různými typy přístupu existují různé typy polí RAID, které se obvykle vyznačují úrovněmi RAID. Kromě typu přístupu se úrovně RAID liší ve způsobu, jakým přidělují a generují redundantní informace. Redundantní informace lze buď umístit na speciálně přidělený disk, nebo je zamíchat mezi všechny disky. Existuje několik dalších způsobů, jak tyto informace generovat.

Nejjednodušší z nich je úplná duplikace (100% redundance), neboli zrcadlení. Kromě toho se používají kódy pro opravu chyb a výpočty parity.

Úrovně RAID

RAID úrovně 0, přísně vzato, není redundantní pole, a proto neposkytuje spolehlivé úložiště dat. Přesto je tato úroveň hojně využívána v případech, kdy je potřeba zajistit vysoký výkon diskového subsystému. Tato úroveň je oblíbená zejména na pracovních stanicích. Při vytváření pole RAID úrovně 0 se informace rozdělí do bloků, které se zapíší na samostatné disky (obr. 4), tedy vznikne systém s paralelním přístupem (pokud to samozřejmě velikost bloku umožňuje). Tím, že umožňuje simultánní I/O z více disků, poskytuje RAID 0 nejvyšší rychlost přenosu dat a maximální efektivitu místa na disku, protože není potřeba žádný úložný prostor pro kontrolní součty. Implementace této úrovně je velmi jednoduchá. RAID 0 se používá především v oblastech, kde je vyžadován rychlý přenos velkého množství dat.

RAID 1 (zrcadlený disk)

RAID Level 1 je pole disků se 100% redundancí. To znamená, že data jsou jednoduše zcela duplikována (zrcadlena), díky čemuž je dosaženo velmi vysoké úrovně spolehlivosti (a také nákladů). Všimněte si, že pro implementaci úrovně 1 není nutné nejprve rozdělit disky a data do bloků. V nejjednodušším případě dva disky obsahují stejné informace a jsou jedním logickým diskem (obr. 5). Pokud jeden disk selže, jeho funkce vykonává jiný (což je pro uživatele naprosto transparentní).

Tato úroveň navíc zdvojnásobuje rychlost čtení informací, protože tuto operaci lze provádět současně ze dvou disků. Toto schéma ukládání informací se používá především v případech, kdy jsou náklady na zabezpečení dat mnohem vyšší než náklady na implementaci úložného systému.

RAID 2

Kromě toho je pro každé slovo vypočítán kód opravy chyb (ECC), který je zapsán na vyhrazené disky pro uložení řídicích informací (obr. 6). Jejich počet se rovná počtu bitů v řídicím slově a každý bit řídicího slova je zapsán na samostatný disk. Počet bitů v řídicím slově a podle toho požadovaný počet disků pro uložení řídicí informace se vypočítá na základě následujícího vzorce: kde K je bitová hloubka datového slova.

Při výpočtu pomocí zadaného vzorce se L přirozeně zaokrouhlí nahoru na nejbližší celé číslo. Abyste si však nepletli se vzorci, můžete použít další mnemotechnické pravidlo: bitová hloubka řídicího slova je určena počtem bitů potřebných pro binární vyjádření velikosti slova. Pokud je například velikost slova čtyři (v binárním zápisu 100), pak k zápisu tohoto čísla v binární podobě jsou vyžadovány tři číslice, což znamená, že velikost řídicího slova je tři. Pokud tedy existují čtyři disky pro uložení dat, budou k uložení řídicích dat zapotřebí další tři disky. Podobně, pokud máte sedm disků pro data (v binárním zápisu 111), budete potřebovat tři disky pro uložení řídicích slov. Pokud je pro data alokováno osm disků (v binárním zápisu 1000), pak jsou pro řídicí informace potřeba čtyři disky.

Hammingův kód, který tvoří řídicí slovo, je založen na použití bitové operace „exclusive OR“ (XOR) (také nazývané „disparita“).

Připomeňme, že logická operace XOR dává jedničku, pokud se operandy neshodují (0 a 1), a nulu, pokud se shodují (0 a 0 nebo 1 a 1).

Samotné řídicí slovo, získané pomocí Hammingova algoritmu, je inverzí výsledku bitové exkluzivní operace OR čísel těch informačních bitů slova, jejichž hodnoty se rovnají 1. Pro ilustraci uvažujme původní slovo 1101 V prvním (001), třetím (011) a čtvrtém (100) Číslice tohoto slova mají hodnotu jedné.

Při čtení dat je opět vypočítán Hammingův kód a porovnán se zdrojovým kódem. Pro porovnání dvou kódů se používá bitová operace „exclusive OR“. Pokud je výsledek porovnání ve všech bitech nula, pak je čtení správné, jinak je jeho hodnota číslem chybně přijatého bitu hlavního kódu. Nechť je zdrojové slovo například 1 100 000, protože jedničky jsou na šesté (110) a sedmé (111) pozici, je řídicí slovo:

Je-li během čtení zaznamenáno slovo 1100100, pak je jeho řídicí slovo rovno 101. Porovnáním původního řídicího slova s ​​přijatým (operace bitově exkluzivní OR) máme:

tedy chyba čtení na třetí pozici.

Pokud tedy přesně víme, který bit je chybný, lze jej snadno opravit za běhu.

RAID 2 je jedna z mála úrovní, která umožňuje nejen opravit jednotlivé chyby za chodu, ale také odhalit dvojité. Navíc je to nejredundantnější ze všech úrovní s korekčními kódy. Toto schéma úložiště dat se používá jen zřídka, protože nezvládá dobře velké množství požadavků, je složité na organizaci a oproti RAID 3 má jen málo výhod.

RAID 3

RAID Level 3 je pole odolné proti chybám s paralelními I/O a jedním dalším diskem, na který se zapisují řídicí informace (obrázek 7). Při záznamu je datový tok rozdělen do bloků na úrovni bajtů (i když možná na úrovni bitů) a je zapsán současně na všechny disky pole, kromě toho, který je přidělen pro ukládání řídicích informací. Pro výpočet řídicí informace (také nazývané kontrolní součet) se na zapisované datové bloky aplikuje operace exkluzivní nebo XOR. Pokud některý disk selže, data na něm lze obnovit pomocí kontrolních dat a dat zbývajících na zdravých discích.

Pro ilustraci uvažujme bloky o čtyřech bitech. Nechť jsou čtyři disky pro ukládání dat a jeden disk pro záznam kontrolních součtů. Pokud existuje posloupnost bitů 1101 0011 1100 1011, rozdělených do bloků po čtyřech bitech, pak pro výpočet kontrolního součtu je nutné provést operaci:

Kontrolní součet zapsaný na pátý disk je tedy 1001.

Pokud jeden z disků, například třetí, selže, pak blok 1100 nebude dostupný pro čtení. Jeho hodnotu však lze snadno obnovit pomocí kontrolního součtu a hodnot zbývajících bloků pomocí stejné operace „exclusive OR“:

Blok 3 = Blok 1 Blok 2 Blok 4

Kontrolní součet.

V našem příkladu dostaneme:

Blok 3=1101001110111001= 1100.

RAID Level 3 má mnohem menší redundanci než RAID 2. Díky rozdělení dat do bloků má RAID 3 vysoký výkon. Při čtení informací se na disk nepřistupuje pomocí kontrolních součtů (pokud nedojde k selhání), k čemuž dochází pokaždé, když dojde k operaci zápisu. Protože každá I/O operace přistupuje prakticky ke všem diskům v poli, není možné zpracovávat více požadavků současně. Tato úroveň je vhodná pro aplikace s velkými soubory a nízkou frekvencí přístupu. Mezi výhody RAID 3 navíc patří mírný pokles výkonu v případě poruchy a rychlá obnova informací.

RAID 4

RAID Level 4 je pole nezávislých disků odolné proti chybám s jednou jednotkou pro ukládání kontrolních součtů (obrázek 8). RAID 4 je v mnoha ohledech podobný RAID 3, ale od druhého se liší především výrazně větší velikostí bloku zapisovaných dat (větší než velikost zapisovaných dat).

To je hlavní rozdíl mezi RAID 3 a RAID 4. Po zapsání skupiny bloků se (stejným způsobem jako v případě RAID 3) vypočítá kontrolní součet, který se zapíše na vyhrazený disk. S větší velikostí bloku než RAID 3 lze provádět více operací čtení současně (nezávislý návrh přístupu).

RAID 4 zlepšuje výkon přenosů malých souborů (paralelizací operace čtení). Ale protože záznam musí počítat kontrolní součet na přiděleném disku, současné operace zde nejsou možné (existuje asymetrie vstupních a výstupních operací). Uvažovaná úroveň neposkytuje výhody rychlosti při přenosu velkého množství dat. Toto schéma úložiště bylo navrženo pro aplikace, ve kterých jsou data zpočátku rozdělena do malých bloků, takže je není potřeba dále rozdělovat. RAID 4 je dobré řešení pro souborové servery, kde se informace primárně čtou a jen zřídka zapisují. Toto schéma ukládání dat má nízkou cenu, ale jeho implementace je poměrně složitá, stejně jako obnova dat v případě selhání.

RAID úrovně 5 je chybové pole nezávislých disků s distribuovaným úložištěm kontrolních součtů (obr. 9). Datové bloky a kontrolní součty, které se počítají stejným způsobem jako v RAID 3, se zapisují cyklicky na všechny disky pole, to znamená, že neexistuje žádný vyhrazený disk pro ukládání informací o kontrolním součtu.

V případě RAID 5 jsou všechny disky v poli stejně velké, ale celková kapacita diskového subsystému dostupná pro zápis se zmenší přesně o jeden disk.

Pokud má například pět disků velikost 10 GB, pak skutečná velikost pole je 40 GB, protože 10 GB je přiděleno pro řídicí informace.

RAID 5, stejně jako RAID 4, má architekturu nezávislého přístupu, to znamená, že na rozdíl od RAID 3 poskytuje velkou velikost logických bloků pro ukládání informací. Proto, stejně jako v případě RAID 4, poskytuje takové pole hlavní výhodu při zpracování několika požadavků současně.

Hlavním rozdílem mezi RAID 5 a RAID 4 je způsob umístění kontrolních součtů.

Přítomnost samostatného (fyzického) disku uchovávajícího informace o kontrolních součtech zde, stejně jako ve třech předchozích úrovních, vede k tomu, že operace čtení, které nevyžadují přístup na tento disk, jsou prováděny vysokou rychlostí. Každá operace zápisu však mění informace na řídicím disku, takže RAID 2, RAID 3 a RAID 4 neumožňují paralelní zápisy.

RAID 5 tuto nevýhodu nemá, protože kontrolní součty se zapisují na všechny disky v poli, což umožňuje provádět více čtení nebo zápisů současně.

Praktické provedení

Charakteristickým znakem řadičů RAID je počet podporovaných kanálů pro připojení pevných disků. Přestože k jednomu kanálu řadiče lze připojit více jednotek SCSI, celková propustnost pole RAID bude omezena propustností jednoho kanálu, která odpovídá propustnosti rozhraní SCSI. Použití více kanálů tedy může výrazně zlepšit výkon diskového subsystému.

Při použití řadičů IDE RAID se vícekanálový problém stává ještě naléhavějším, protože dva pevné disky připojené k jednomu kanálu (více disků není podporováno samotným rozhraním) nemohou poskytovat paralelní provoz - rozhraní IDE umožňuje přístup pouze k jednomu disku na čas . Proto musí být řadiče IDE RAID alespoň dvoukanálové.

Existují také čtyř- a dokonce osmikanálové ovladače.

Hlavní funkcí pole RAID není navyšování kapacity diskového subsystému (jak je patrné z jeho konstrukce, stejnou kapacitu lze získat za méně peněz), ale zajištění spolehlivého ukládání dat a zvýšení výkonu.

U serverů je navíc požadavek na nepřetržitý provoz, i když jeden z disků selže. Nepřerušovaný provoz je zajištěn hot swappingem, tedy vyjmutím vadného SCSI disku a instalací nového bez vypnutí napájení. Protože diskový subsystém zůstává funkční (kromě úrovně 0), když selže jeden disk, výměna za chodu poskytuje obnovu, která je pro uživatele transparentní. Přenosová rychlost a přístupová rychlost s jedním nefunkčním diskem jsou však znatelně sníženy kvůli tomu, že řadič musí obnovovat data z nadbytečných informací. Je pravda, že z tohoto pravidla existuje výjimka - systémy RAID úrovní 2, 3, 4, když disk s nadbytečnými informacemi selže, začnou pracovat rychleji! To je přirozené, protože v tomto případě se úroveň „za běhu“ mění na nulu, což má vynikající rychlostní charakteristiky.


Doposud byl tento článek o hardwarových řešeních. Existuje ale také software, který nabízí například Microsoft pro Windows 2000 Server. Některé počáteční úspory jsou však v tomto případě zcela neutralizovány dodatečnou zátěží centrálního procesoru, který je kromě své hlavní práce nucen distribuovat data mezi disky a počítat kontrolní součty. Takové řešení lze považovat za přijatelné pouze v případě výrazného přebytku výpočetního výkonu a nízké zátěže serveru.

Sergej Pakhomov

ComputerPress 3"2002

A tak dále, tak dále, tak dále, tak dále. Dnes tedy budeme hovořit o polích RAID na nich založených.

Jak víte, tyto stejné pevné disky mají také určitou bezpečnostní rezervu, po které selžou, a také vlastnosti, které ovlivňují výkon.

Určitě také víte (a pokud nevíte, nevadí), že tato pole mají různá sériová čísla (0, 1, 2, 3, 4 atd.), a také plní zcela odlišné funkce. Tento jev se v přírodě skutečně vyskytuje a jak jste již uhodli, jsou to stejná pole RAID, o kterých vám chci v tomto článku říci. Přesněji, už vám to říkám ;)

Jdeme.

Co je RAID a proč je potřeba?

RAID je diskové pole (tedy komplex nebo chcete-li svazek) více zařízení – pevných disků. Jak jsem uvedl výše, toto pole slouží ke zvýšení spolehlivosti ukládání dat a/nebo ke zvýšení rychlosti čtení/zápisu informací (nebo obojího).

Co přesně tato parta disků dělá, tedy zrychlení práce nebo zvýšení bezpečnosti dat, záleží na vás, přesněji na volbě aktuální konfigurace raidu(ů). Různé typy těchto konfigurací jsou označeny různými čísly: 1, 2, 3, 4 a podle toho plní různé funkce.

Jde jen o to, že pokud například postavíte 0. verzi (popis variant 0, 1, 2, 3 atd. - čtěte níže), získáte znatelné zvýšení produktivity. A obecně, pevný disk je dnes jen úzký kanál ve výkonu systému.

Proč se to obecně stalo?

Pevné disky narůstají pouze na objemu, protože rychlost otáčení jejich hlavy (s výjimkou vzácných modelů jako Raptor) je již nějakou dobu zmrazena na hodnotě kolem 7200, cache také neroste, architektura zůstává téměř stejná .

Obecně výkonově disky stagnují (situaci lze zachránit pouze vývojem), ale na chodu systému a místy i plnohodnotných aplikací se významně podílejí.

V případě sestavení jediného (ve smyslu číslo 1) raidu sice trochu ztratíte na výkonu, ale dostanete jakousi hmatatelnou záruku bezpečnosti vašich dat, protože budou zcela duplicitní a v podstatě i když selže jeden disk, tak to celé a bude úplně na druhém beze ztrát.

Obecně opakuji, nájezdy se budou hodit všem. Dokonce bych řekl, že jsou povinné :)

Co je RAID ve fyzickém smyslu?

Fyzicky se pole RAID skládá ze dvou až n počtu připojených pevných disků, které podporují možnost vytvořit RAID (nebo na vhodném řadiči, což je méně obvyklé, protože jsou pro běžného uživatele drahé (řadiče se obvykle používají na serverech kvůli jejich zvýšená spolehlivost a výkon)), tj. Na první pohled se uvnitř systémové jednotky nic nemění, prostě neexistují žádné zbytečné spoje nebo spoje disků mezi sebou nebo s čímkoli jiným.

Obecně je v hardwaru vše téměř stejné jako vždy a mění se pouze softwarový přístup, který vlastně výběrem typu raidu nastavuje, jak přesně mají připojené disky fungovat.

Programově se v systému po vytvoření raidu také neobjevují žádné speciální vrtochy. Ve skutečnosti celý rozdíl v práci s raidem spočívá pouze v malém nastavení, které vlastně raid organizuje (viz níže) a v použití ovladače. Jinak je VŠE naprosto stejné - v „Tento počítač“ jsou stejné jednotky C, D a další, všechny stejné složky, soubory... Obecně a v softwaru jsou na pohled zcela totožné.

Instalace pole není obtížná: vezmeme pouze základní desku, která podporuje technologii RAID, vezmeme dvě zcela identické - to je důležité! , - jak podle charakteristik (velikost, cache, rozhrani atd.), tak podle vyrobce a modelu disku a pripojit je k teto zakladni desce. Dále jednoduše zapněte počítač, přejděte do BIOSu a nastavte parametr Konfigurace SATA: RAID.

Poté se během procesu spouštění počítače (obvykle před spuštěním Windows) objeví panel zobrazující informace o discích v raidu a mimo něj, kde ve skutečnosti musíte stisknout CTR-I pro konfiguraci raidu (přidat disky k němu, smazat atd. atd.) . To je vlastně všechno. Pak jsou tu další radosti života, tedy opět vše jako vždy.

Důležitá poznámka k zapamatování

Při vytváření nebo mazání raidu (zdá se, že to neplatí pro 1. raid, ale není to skutečnost) se z disků nevyhnutelně smažou všechny informace, a proto se zjevně nevyplatí pouze provádět experiment, vytvářet a mazat různé konfigurace. Před vytvořením raidu si proto nejprve uložte všechny potřebné informace (pokud je máte) a poté experimentujte.

Co se týče konfigurací.. Jak jsem již řekl, existuje několik typů RAID polí (alespoň z hlavního základu je to RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6). Pro začátek budu mluvit o dvou, které jsou mezi běžnými uživateli nejsrozumitelnější a nejoblíbenější:

  • RAID 0 - diskové pole pro zvýšení rychlosti zápisu.
  • RAID 1 - zrcadlené diskové pole.

A na konci článku rychle projdu ostatní.

RAID 0 - co to je a k čemu se používá?

A tak... RAID 0 (také známý jako Striping) – používá dva až čtyři (více, méně často) pevné disky, které společně zpracovávají informace, což zvyšuje výkon. Aby bylo jasno, nošení tašek pro jednu osobu trvá déle a je obtížnější než pro čtyři osoby (ačkoli tašky zůstávají ve svých fyzických vlastnostech stejné, mění se pouze síly, které s nimi interagují). Programově jsou informace o raidu tohoto typu rozděleny do datových bloků a zapisovány postupně na oba/několik disků.

Jeden blok dat na jednom disku, další blok dat na jiném a tak dále. Výrazně se tím zvyšuje výkon (počet disků určuje násobnost nárůstu výkonu, tj. 4 disky poběží rychleji než dva), ale utrpí bezpečnost dat na celém poli. Pokud některý z pevných disků zahrnutých v takovém RAID selže, všechny informace jsou téměř úplně a nenávratně ztraceny.

Proč? Faktem je, že každý soubor se skládá z určitého počtu bajtů... z nichž každý nese informaci. Ale v poli RAID 0 mohou být bajty jednoho souboru umístěny na několika discích. Pokud tedy jeden z disků „umře“, dojde ke ztrátě libovolného počtu bajtů souboru a bude jednoduše nemožné jej obnovit. Ale existuje více než jeden soubor.

Obecně se při použití takového pole raid důrazně doporučuje trvale ukládat cenné informace na externí média. Raid opravdu poskytuje znatelnou rychlost – říkám vám to z vlastní zkušenosti, protože takové štěstí mám doma nainstalované už léta.

RAID 1 - co to je a k čemu se používá?

Pokud jde o RAID 1 (Mirroring - „zrcadlení“)... Vlastně začnu s nevýhodou. Na rozdíl od RAID 0 se ukazuje, že tak trochu „ztratíte“ prostor druhého pevného disku (používá se k zapsání kompletní (bajt po bajtu) kopie prvního pevného disku, zatímco u RAID 0 je tento prostor zcela k dispozici).

Výhodou, jak jste již pochopili, je vysoká spolehlivost, to znamená, že vše funguje (a všechna data existují v přírodě a nezmizí, když jedno ze zařízení selže), pokud je funkční alespoň jeden disk, tzn. I když hrubě zničíte jeden disk, neztratíte ani jeden bajt informací, protože druhý je čistou kopií prvního a nahradí ho, když selže. Takový raid se často používá na serverech kvůli neuvěřitelné životaschopnosti dat, což je důležité.

Při tomto přístupu je obětován výkon a podle osobních pocitů je to ještě méně než při použití jednoho disku bez jakýchkoli nájezdů. Pro některé je však spolehlivost mnohem důležitější než výkon.

RAID 2, 3, 4, 5, 6 - co to je a k čemu se používají?

Popis těchto polí je zde co nejvíce, tzn. čistě pro referenci, a to i v komprimované podobě (ve skutečnosti je popsána pouze ta druhá). proč tomu tak je? Minimálně kvůli nízké oblibě těchto polí mezi průměrným (a obecně jakýmkoli jiným) uživatelem a v důsledku toho i mé malé zkušenosti s jejich používáním.

RAID 2 je vyhrazen pro pole, která používají nějaký Hammingův kód (nezajímalo mě, co to bylo, takže vám to neřeknu). Princip fungování je přibližně tento: data jsou zapisována na odpovídající zařízení stejným způsobem jako v RAID 0, to znamená, že jsou rozdělena do malých bloků napříč všemi disky, které se podílejí na ukládání informací.

Na zbývajících discích (speciálně přidělených pro tento účel) jsou uloženy kódy opravy chyb, které lze použít k obnovení informací, pokud některý pevný disk selže. Takže v polích tohoto typu jsou disky rozděleny do dvou skupin - pro data a pro kódy opravy chyb

Máte například dva disky, které poskytují místo pro systém a soubory, a dva další budou zcela vyhrazeny pro korekční data v případě, že první dva disky selžou. V podstatě se jedná o něco jako zero raid, jen s možností alespoň nějak uložit informace v případě poruchy některého z pevných disků. Zřídka drahé - čtyři disky místo dvou s velmi kontroverzním zvýšením bezpečnosti.

RAID 3, 4, 5, 6... O nich, ať už to na stránkách tohoto webu zní jakkoli divně, zkuste si o nich přečíst na Wikipedii. Faktem je, že ve svém životě jsem se s těmito poli setkal extrémně zřídka (kromě toho, že páté mi přišlo pod ruku častěji než ostatní) a nedokáži srozumitelnými slovy popsat principy jejich fungování a absolutně nechci přetiskovat článek z výše navrhovaného zdroje, alespoň kvůli přítomnosti vznětlivých formulací v nich, kterým i já sotva rozumím.

Jaký RAID byste si měli vybrat?

Pokud hrajete hry, často kopírujete hudbu, filmy nebo instalujete programy náročné na zdroje, pak se vám RAID 0 jistě bude hodit. Buďte ale opatrní při výběru pevných disků – v tomto případě je důležitá především jejich kvalita – nebo si určitě zálohujte na externí média.

Pokud pracujete s cennými informacemi, jejichž ztráta se rovná smrti, pak rozhodně potřebujete RAID 1 - s ním je nesmírně obtížné ztratit informace.

Opakuji, že je velmi žádoucí, aby disky osazené v RAID poli byly totožné. Velikost, značka, série, velikost cache – vše by mělo být pokud možno stejné.

Doslov

Tak se věci mají.

Mimochodem, jak sestavit tento zázrak jsem napsal v článku: " Jak vytvořit pole RAID pomocí standardních metod"a o několika parametrech v materiálu" RAID 0 dvou SSD, - praktické testy s Read Ahead a Read Cache". Použijte vyhledávání.

Upřímně doufám, že vám tento článek bude užitečný a určitě si uděláte nájezd toho či onoho typu. Věřte mi, stojí to za to.

Pokud máte dotazy týkající se jejich vytváření a konfigurace, obecně mě můžete kontaktovat v komentářích - pokusím se pomoci (pokud existují pokyny pro vaši základní desku online). Budu také rád za jakékoli doplnění, přání, myšlenky a tak dále.

Podání žádosti

Popis polí RAID ( , )

Popis RAID 0


Vysoce výkonné diskové pole bez odolnosti proti chybám
Pruhované diskové pole bez odolnosti proti chybám

RAID 0 je nejvýkonnější a nejméně bezpečný ze všech RAID. Data jsou rozdělena do bloků úměrně počtu disků, což vede k vyšší propustnosti. Vysoký výkon této struktury je zajištěn paralelním záznamem a absencí redundantního kopírování. Selhání jakékoli jednotky v poli má za následek ztrátu všech dat. Tato úroveň se nazývá pruhování.

výhody:
- · nejvyšší výkon pro aplikace vyžadující intenzivní zpracování I/O požadavků a velké objemy dat;
- · snadnost provádění;
- · nízké náklady na jednotku objemu.
nedostatky:
- · není řešení odolné vůči chybám;
- · Selhání jednoho disku znamená ztrátu všech dat v poli.

Popis RAID 1


Redundantní nebo zrcadlené diskové pole
Duplexní a zrcadlení
RAID 1 - mirroring - zrcadlení dvou disků. Redundance struktury tohoto pole zajišťuje jeho vysokou odolnost proti chybám. Pole se vyznačuje vysokou cenou a nízkou produktivitou.

výhody:
- · snadnost provádění;
- · snadnost obnovy pole v případě selhání (kopírování);
- · dostatečně vysoký výkon pro aplikace s vysokou intenzitou požadavků.
nedostatky:
- · vysoké náklady na jednotku objemu - 100% redundance;
- · nízká rychlost přenosu dat.

Popis RAID 2


Diskové pole odolné proti chybám pomocí Hammingova kódu
Hammingův kód ECC
RAID 2 - používá Hamming Code ECC. Kódy vám umožňují opravit jednotlivé chyby a detekovat dvojité chyby.

výhody:
- · rychlá oprava chyb („za běhu“);
- velmi vysoká rychlost přenosu velkých dat;
- · s rostoucím počtem disků se režijní náklady snižují;
- · celkem jednoduchá implementace.
nedostatky:
- · vysoká cena s malým počtem disků;
- · nízká rychlost zpracování požadavků (nevhodné pro transačně orientované systémy).

Popis RAID 3


Pole odolné vůči chybám s paralelním přenosem dat a paritou
Paralelní přenosové disky s paritou

RAID 3 - data jsou ukládána na principu stripingu na úrovni bajtů s kontrolním součtem (CS) na jednom z disků. Pole nemá problém s určitou redundancí jako u RAID úrovně 2. Jednotky kontrolního součtu používané v RAID 2 jsou potřebné k detekci chybných nabití. Většina moderních řadičů je však schopna určit, kdy disk selhal, pomocí speciálních signálů nebo dodatečného kódování informací zapsaných na disk a použitých k opravě náhodných selhání.

výhody:
- velmi vysoká rychlost přenosu dat;
- · porucha disku má malý vliv na rychlost pole;
- · nízké režijní náklady na zavedení redundance.
nedostatky:
- · obtížná implementace;
- · nízký výkon s vysokou intenzitou požadavků na malá data.

Nadšenci mají nepsané pravidlo: pevný disk Raptor Western Digital WD1500 je ideální stolní model, pokud potřebujete maximální výkon. Ne všichni uživatelé ale mohou jít touto cestou, protože utratit 240 dolarů za pevný disk s kapacitou pouhých 150 GB není příliš atraktivní řešení. Je Raptor stále tou nejlepší volbou? Cena se neměnila dlouhé měsíce a dnes za takové peníze pořídíte klidně i dvojici 400GB disků. Není čas porovnat výkon moderních RAID polí s Raptorem?

Nadšenci znají pevné disky Raptor, protože je to jediný 3,5" pevný disk pro stolní počítače, který se otáčí rychlostí 10 000 ot./min. Většina pevných disků v tomto tržním sektoru se točí rychlostí 7 200 ot./min. Pouze špičkové pevné disky pro servery se točí rychleji. Pevné disky WD Raptor 36 a 74 GB byly představeny před třemi lety. Zhruba před rokem vstoupila na trh Western Digital Raptor-X, který poskytuje vyšší výkon, jsou k dispozici modely i s průhledným krytem, ​​který umožňuje nahlédnout dovnitř pevného disku.

Po uvedení na trh předčily pevné disky Western Digital Raptor všechny ostatní 3,5" pevné disky Serial ATA pro stolní počítače, ačkoli byly původně určeny pro levné servery.

Rychlost vřetena 10 000 ot./min nabízí dvě významné výhody. Za prvé, rychlost přenosu dat se znatelně zvyšuje. Ano, maximální rychlost sekvenčního čtení není nijak zvlášť působivá, ale minimální rychlost je mnohem vyšší než u jakéhokoli pevného disku se 7 200 otáčkami za minutu. Pevný disk s 10 000 otáčkami za minutu má navíc menší latenci roztočení, což znamená, že po umístění čtecích/zapisovacích hlav trvá disku méně času na získání dat.

Hlavní nevýhodou WD Raptor je cena – asi 240 dolarů za 150 GB model. Mezi další nevýhody zaznamenáváme vyšší (i když ne kritickou) hladinu hluku a vyšší tvorbu tepla. Nadšenci se však s podobnými nedostatky snadno smíří, pokud tento pevný disk poskytuje vyšší výkon úložného subsystému.

Pokud si spočítáte náklady na uložení gigabajtu dat, pak už Raptor nebude tak atraktivní. Za 240 dolarů můžete získat dvojici 400 GB pevných disků a úroveň 300 dolarů za 750 GB Seagate Barracuda 7200.10 není daleko. Pokud se podíváte na low-end segment, můžete získat dvojici 160GB 7 200 RPM pevných disků za 50 $ každý, které poskytnou stejnou kapacitu jako Raptor, ale za více než poloviční cenu. Proto si dnes i nadšenci často kladou otázku: Vyplatí se brát WD Raptor, není lepší zvolit konfiguraci RAID 0 na dvou 7200otáčkových pevných discích?

RAID 0 nezkracuje přístupovou dobu, ale téměř zdvojnásobuje rychlost sekvenčního čtení, protože data jsou distribuována na dva pevné disky. Nevýhodou je zvýšené riziko ztráty dat, jelikož při poruše jednoho pevného disku dojde ke ztrátě celého pole (dnes však existují i ​​možnosti Obnova informací RAID). Mnoho integrovaných řadičů na základních deskách vyšší třídy podporuje režimy RAID, které se snadno konfigurují a instalují.

Rychlý nebo chytrý pevný disk?

Výkon Kapacita Zabezpečení datového úložiště Cena
Jeden pevný disk (7200 ot./min.) dobrý Spravedlivé až vynikající Dostatečná * Nízká až vysoká, 50 až 300 USD
150 GB WD Raptor (10 000 ot./min) Vynikající Dostatečný Dostatečná * Nejvyšší: 240 $ a více
2x 160 GB (7 200 ot./min.) Velmi dobré až vynikající Dobré až vynikající Nedostatečná * Low to High: 50 $ za HDD
2x 150 GB WD Raptor (10 000 ot./min) Vynikající dobrý Nedostatečná * Vysoká až velmi vysoká: 240 USD za jednotku

* Je třeba mít na paměti, že jakýkoli pevný disk dříve nebo později selže. Technologie je založena na mechanických součástech a jejich životnost je omezená. Výrobci u pevných disků udávají dobu mezi poruchami (MTBF, Mean Time Between Failures). Pokud máte pole RAID 0 nainstalované na dvou 7200otáčkových pevných discích, pak se riziko ztráty dat zdvojnásobí, protože při poruše jednoho pevného disku přijdete o celé pole RAID 0, proto pravidelně zálohujte důležitá data a vytvořte si image operační systém.

40-80GB pevné disky dnes pořídíte téměř za drobné a pokud nemáte speciální nároky na kapacitu, tak vám tento objem vystačí i dnes. Doporučujeme však získat pevné disky za cenu mezi 50 a 70 USD, protože snadno seženete modely s kapacitou od 120 do 200 GB. V internetových obchodech se již začaly objevovat modely s 250 a 320 GB za cenu pod 100 dolarů. Za peníze, které utratíte za 10 000 RPM WD Raptor, můžete snadno získat kapacitu 800 GB až 1 TB na 7 200 RPM pevných discích.

Pokud nepotřebujete tak vysokou kapacitu, můžete se spokojit se základními pevnými disky 7200 RPM. Dva disky Western Digital WD1600AAJS stojí každý 55 USD a v poli RAID 0 snadno získáte 320 GB kapacity. Utratíte polovinu peněz a získáte dvojnásobnou kapacitu. Jak oprávněné jsou takové úspory? Pojďme na to přijít.

7 200 nebo 10 000 otáček za minutu? RAID 0 nebo Raptor?

Rozhodli jsme se otestovat různé konfigurace pevných disků. Naše testování zahrnuje jeden WD Raptor WD1500ADFD, jeden WD4000KD, Raptor v RAID 0 a WD4000 v RAID 0. Rozhodli jsme se použít 400GB WD 7200 RPM pevné disky, protože dva z těchto disků mají zhruba stejnou cenu jako jeden Raptor. Podívejme se, jak dobře funguje „rozpočtové“ pole RAID ve srovnání s jedním Raptorem.

WD4000KD je vybaven 16 MB vyrovnávací paměti a má rozhraní Serial ATA/150. Hlavním rozdílem oproti 10 000 ot./min WD Raptor je výkon a kapacita. Raptor přichází se značnými náklady na gigabajt úložiště, což je nejméně šestkrát více než u 400GB WD4000KD. Testy ukážou, jak velké jsou výkonnostní rozdíly. V době zveřejnění byla cena WD4000KD Caviar 130 $.

Raptor je nesporným šampionem ve výkonu na trhu stolních počítačů, ale je to také nejdražší pevný disk. WD1500 Raptor používá rozhraní Serial ATA/150, které je stále dostačující. Pokud se podíváte na výsledky testů, žádný jiný pevný disk Raptor nepřekoná, a to ani s rozhraním SATA 300 MB/s. Obecně platí, že rychlost rozhraní SATA by při vašem rozhodování o nákupu neměla zohledňovat. V době zveřejnění byla cena WD1500ADFD Raptor 240 $.

Tato konfigurace by měla převzít WD1500 Raptor. Mohou dva pevné disky WD4000KD v poli RAID 0 porazit Raptor?

Tento scénář je nejdražší v našem testování, protože vyžaduje dva pevné disky WD Raptor, ale i tak je velmi zajímavý. Dva 10 000otáčkové pevné disky Raptor v poli RAID 0 by měly doslova zničit každého.

RAID 0

Výkon

Teoreticky je RAID 0 ideální pro zvýšení výkonu, protože rychlost sekvenčního přenosu dat se mění téměř lineárně s počtem pevných disků v poli. Soubory jsou distribuovány blok po bloku na všechny pevné disky, to znamená, že řadič RAID zapisuje data téměř současně na několik pevných disků. Rychlosti přenosu dat RAID 0 se znatelně zvyšují téměř ve všech scénářích, i když přístupové časy se nezkracují. V reálných testech se přístupové časy v polích RAID 0 dokonce prodlužují, i když velmi mírně, asi o půl milisekundy.

Pokud vytvoříte konfiguraci RAID na několika pevných discích, může se stát překážkou řadič disku. Běžná PCI sběrnice dokáže přenést maximálně 133 MB/s, což bez problémů pohltí dva moderní pevné disky. Řadiče Serial ATA, které jsou součástí čipové sady, obecně poskytují vyšší propustnost, takže neomezují výkon polí RAID.

Máme až 350 MB/s na čtyřech pevných discích WD Raptor s 10 000 otáčkami za minutu na čipsetech s jižními můstky Intel ICH7 a ICH8. Vynikající výsledek, který se velmi blíží celkové propustnosti čtyř samostatných pevných disků. Čipset nVidia nForce 680 přitom ukázal maximum 110 MB/s, bohužel. Zdá se, že ne každý integrovaný řadič RAID je schopen poskytovat vysoce výkonná pole RAID, i když je to technicky možné.

Porovnání režimů RAID

Je třeba poznamenat, že RAID 0 ve skutečnosti nepokrývá myšlenku polí RAID, což je zkratka pro Redundant Arrays of Independent/Inexpensive Drives. Redundance znamená ukládání dat alespoň na dvě místa, aby přežila, i když jeden pevný disk selže. To se děje například v případě pole RAID 1, ve kterém jsou všechna data zrcadlena na druhý pevný disk. Pokud jeden z pevných disků „umře“, dozvíte se to pouze ze zpráv řadiče RAID. RAID 5 je mnohem komplexnější a je zaměřen na profesionální sektor. Funguje jako pole RAID 0, distribuuje data na všechny pevné disky, ale k datům jsou přidány informace o redundanci. Čistá kapacita pole RAID 5 se tedy rovná celkové kapacitě všech pevných disků kromě jednoho. Informace o redundanci se nezapisují na jeden pevný disk (jako v případě RAID 3), ale jsou distribuovány napříč všemi disky, aby nedocházelo k vytváření úzkých míst při čtení nebo zápisu informací o redundanci na jeden HDD. Pole RAID 5 celkem pochopitelně vyžaduje minimálně tři pevné disky.

Rizika a vedlejší účinky

Hlavním nebezpečím pro pole RAID 0 je selhání jakéhokoli pevného disku, protože je ztraceno celé pole. Proto čím více disků v poli RAID 0, tím vyšší je riziko ztráty informací. Pokud jsou použity tři pevné disky, pak je pravděpodobnost ztráty informací třikrát vyšší než u jednoho disku. To je důvod, proč RAID 0 není dobrou volbou pro uživatele, kteří potřebují spolehlivý systém a nemohou si dovolit ani minutu výpadku.

I když si koupíte výkonný a drahý samostatný RAID řadič, stále budete závislí na hardwaru. Dva různé řadiče mohou podporovat RAID 5, ale konkrétní implementace se může velmi lišit.



Intel Matrix RAID: Na stejné sadě pevných disků můžete vytvořit různá pole RAID.

Pokud je řadič RAID dostatečně chytrý, může umožnit instalaci dvou nebo více polí RAID na jednu sadu pevných disků. Ačkoli každý řadič RAID může podporovat více polí RAID, nejčastěji to vyžaduje různé sady pevných disků. Velmi zajímavě se proto ukázaly jižní můstky Intel ICH7-R a ICH8-R: podporují funkci Intel Matrix RAID.

Typickou implementací by byla dvě pole RAID na dvou pevných discích. První třetinu kapacity dvou pevných disků lze alokovat do rychlého pole RAID 0 pro operační systém a zbytek do pole RAID 1 pro ukládání důležitých dat. Pokud selže jeden z pevných disků, dojde ke ztrátě operačního systému, ale důležitá data, která jsou zrcadlena na druhý pevný disk, zůstanou zachována díky RAID 1. Mimochodem, po instalaci Windows si můžete vytvořit obraz operačního systému a uložte jej na spolehlivé pole RAID 1. Poté, pokud dojde k selhání pevného disku, lze operační systém rychle obnovit.

Uvědomte si prosím, že mnoho polí RAID vyžaduje instalaci ovladače RAID (jako je Intel Matrix Storage Manager), což může způsobit problémy při spouštění a obnově systému. Každý spouštěcí disk, který použijete pro obnovu, bude potřebovat ovladače RAID. Proto si pro takový případ uschovejte disketu ovladače.

Testovací konfigurace

Konfigurace pro nízkoúrovňové testy

Procesory 2x Intel Xeon (jádro Nocona), 3,6 GHz, FSB800, 1 MB L2 cache
Platforma Asus NCL-DS (Socket 604), čipset Intel E7520, BIOS 1005
Paměť Corsair CM72DD512AR-400 (DDR2-400 ECC, reg.), 2x 512 MB, latence CL3-3-3-10
Systémový pevný disk Western Digital Caviar WD1200JB, 120 GB, 7200 ot./min, 8 MB mezipaměti, UltraATA/100
Ovladače pohonů Řadič Intel 82801EB UltraATA/100 (ICH5)
Silicon Image Sil3124, PCI-X
Síť Integrovaný řadič Broadcom BCM5721 Gigabit Ethernet
Videokarta Vestavěný ATi RageXL, 8 MB
Testy a nastavení
Výkonnostní testy c"t h2benchw 3.6
PCMark05 V1.01
I/O testy IOMeter 2003.05.10
Fileserver-Benchmark
Webový server-Benchmark
Databáze-Benchmark
Pracovní stanice-Benchmark
Systémový software
OS Microsoft Windows Server 2003 Enterprise Edition, Service Pack 1
Ovladač platformy Nástroj pro instalaci čipové sady Intel 7.0.0.1025
Ovladač grafiky Výchozí ovladač grafiky Windows

Konfigurace pro SYSmark2004 SE

Systémový hardware
CPU Intel Core 2 Extreme X6800 (Conroe 65 nm, 2,93 GHz, 4 MB L2 cache)
Základní deska Gigabyte GA-965P-DQ6 2.0, čipset: Intel 965P, BIOS: F9
Obecný hardware
Paměť 2x 1024 MB DDR2-1111 (CL 4.0-4-4-12), Corsair CM2X1024-8888C4D XMS6403v1.1
Videokarta HIS X1900XTX IceQ3, GPU: ATi Radeon X1900 XTX (650 MHz), paměť: 512 MB GDDR3 (1550 MHz)
Pevný disk I 150 GB, 10 000 ot./min, 8 MB mezipaměť, SATA/150, Western Digital WD1500ADFD
Pevný disk II 400 GB, 7 200 ot./min, 16 MB mezipaměť, SATA/300, Western Digital WD4000KD
DVD-ROM Gigabyte GO-D1600C (16x)
Software
Ovladače ATi Catalyst Suite 7.1
Ovladače čipové sady Intel Nástroj pro instalaci softwaru 8.1.1.1010
Ovladače Intel RAID Matrix Storage Manager 6.2.1.1002
DirectX 9.0c (4.09.0000.0904)
OS Windows XP, sestavení 2600 SP2
Testy a nastavení
SYSmark Verze 2004 Druhé vydání, Oficiální běh

No, budeme se muset přesunout k výsledkům souboje mezi současnými 150GB pevnými disky WD Raptor a 400GB WD4000KD v poli RAID 0 Výsledek byl překvapivý. Zatímco WD Raptor zůstává zdaleka nejrychlejším pevným diskem Serial ATA pro stolní počítače, RAID 0 je ve většině benchmarků na špici mimo přístupovou dobu a I/O výkon. Náklady na uložení gigabajtu dat na Raptor jsou nanejvýš diskutabilní, protože za poloviční cenu koupíte pevný disk s trojnásobnou kapacitou 7200 otáček za minutu. To znamená, že při ceně gigabajtu dnes Raptor ztrácí šestkrát. Pokud však máte obavy o zabezpečení dat, dvakrát si rozmyslete, zda si před WD Raptor vyberete pole RAID 0 se dvěma levnými pevnými disky s rychlostí 7 200 ot./min.

V následujících měsících cena 500GB pevných disků klesne pod 100 dolarů. Zvýší se ale požadavky na dostupný prostor pro ukládání videí, hudby a fotografií ve vysokém rozlišení. A konečně, hustota záznamu na plotnách pevných disků stále roste, takže brzy budou k dispozici výkonnější modely se 7 200 otáčkami za minutu. V budoucnu se atraktivita Raptora sníží.

Zdá se nám, že Western Digital by měl změnit cenovou politiku řady Raptor, protože nárůst výkonu přichází na úkor velkých kompromisů v kapacitě pevného disku. A musím říci, že takové kompromisy nebudou připadat oprávněné každému. Rádi bychom viděli aktualizovaný 300GB pevný disk Raptor, který by také mohl fungovat jako hybridní pevný disk s vestavěnou flash pamětí pro Windows Vista.




Nahoru