Domov › Služby › Velikost nájezdového pruhu, kterou si vybrat. Testování v klasických benchmarcích

Velikost nájezdového pruhu, kterou si vybrat. Testování v klasických benchmarcích

Na internetu je spousta článků popisujících RAID. Například tato popisuje vše velmi podrobně. Ale jak už to tak bývá, na přečtení všeho není dost času, takže potřebujete něco krátkého, abyste pochopili - zda je to nutné nebo ne, a co je lepší použít ve vztahu k práci s DBMS (InterBase, Firebird nebo něco jiného - to opravdu je to jedno). Přesně takový materiál máte před očima.

Pro první přiblížení je RAID kombinací disků do jednoho pole. SATA, SAS, SCSI, SSD - na tom nezáleží. Navíc téměř každá normální základní deska nyní podporuje SATA RAID. Pojďme si projít seznam toho, co jsou RAIDy a proč jsou. (Rád bych hned poznamenal, že v RAID je potřeba kombinovat identické disky. Konsolidace disků z různých výrobců, ze stejných, ale různých typů, nebo různých velikostí - to je rozmazlování pro člověka sedícího u domácího počítače).

RAID 0 (proužek)

Zhruba řečeno, jedná se o sekvenční kombinaci dvou (nebo více) fyzické disky na jeden „fyzický“ disk. Hodí se pouze pro organizaci obrovských diskových prostor, například pro ty, kteří pracují se střihem videa. Nemá smysl uchovávat databáze na takových discích – ve skutečnosti, i když má vaše databáze velikost 50 gigabajtů, tak proč jste si koupili dva disky po 40 gigabajtech a ne 1 x 80 gigabajtů? Nejhorší je, že v RAID 0 jakákoliv porucha jednoho z disků vede k úplné nefunkčnosti takového RAIDu, protože data se zapisují střídavě na oba disky a podle toho RAID 0 nemá prostředky pro obnovu v případě poruch.

RAID 0 samozřejmě poskytuje rychlejší výkon díky prokládání čtení/zápisu.

RAID 0 se často používá k hostování dočasných souborů.

RAID 1 (zrcadlový)

Zrcadlení disku. Pokud Shadow v IB/FB je softwarové zrcadlení (viz Operations Guide.pdf), pak RAID 1 je hardwarové zrcadlení a nic víc. Zakažte vám používat zrcadlení softwaru pomocí nástrojů operačního systému nebo softwaru třetích stran. Potřebujete buď „železný“ RAID 1 nebo stín.

Pokud dojde k poruše, pečlivě zkontrolujte, který disk selhal. Nejčastějším případem ztráty dat na RAID 1 jsou nesprávné akce při obnově (špatný disk je označen jako „celek“).

Pokud jde o výkon - zisk pro zápis je 0, pro čtení - možná až 1,5krát, protože čtení lze provádět „paralelně“ (střídavě z různých disků). U databází je zrychlení malé, zatímco při paralelním přístupu k různým (!) částem (souborům) disku bude zrychlení naprosto přesné.

RAID 1+0

Pojmem RAID 1+0 se rozumí možnost RAID 10, kdy jsou dva RAID 1 spojeny do RAID 0. Možnost, kdy jsou dva RAID 0 spojeny do RAID 1, se nazývá RAID 0+1 a „mimo“ se jedná o stejný RAID 10 .

RAID 2-3-4

Tyto RAIDy jsou vzácné, protože používají Hammingovy kódy nebo rozdělení bajtů do bloků + kontrolní součty atd., ale obecné shrnutí je toto - tyto RAID poskytují pouze spolehlivost, s 0 nárůstem výkonu a někdy i zhoršením.

RAID 5

Vyžaduje minimálně 3 disky. Paritní data jsou distribuována na všechny disky v poli

Obvykle se říká, že „RAID5 používá nezávislý přístup k disku, takže požaduje různé disky mohou být prováděny paralelně." Je třeba mít na paměti, že se samozřejmě bavíme o paralelních I/O požadavcích. Pokud takové požadavky půjdou sekvenčně (v SuperServeru), pak samozřejmě nedosáhnete efektu paralelního přístupu na RAID 5. RAID5 samozřejmě zvýší výkon, pokud se s polem pracuje operační systém a další aplikace (bude například obsahovat virtuální paměti, TEMP atd.).

Obecně lze říci, že RAID 5 býval nejčastěji používaným diskovým polem pro práci s DBMS. Nyní lze takové pole organizovat SATA disk x a bude výrazně levnější než SCSI. Ceny a ovladače si můžete prohlédnout v článcích
Kromě toho byste měli věnovat pozornost objemu zakoupených disků - například v jednom ze zmíněných článků je RAID5 sestaven ze 4 disků s kapacitou 34 gigabajtů, zatímco objem „disku“ je 103 gigabajtů.

Testování pěti řadičů SATA RAID - http://www.thg.ru/storage/20051102/index.html.

Adaptec SATA RAID 21610SA v polích RAID 5 - http://www.ixbt.com/storage/adaptec21610raid5.shtml.

Proč je RAID 5 špatný - https://geektimes.ru/post/78311/

Pozor! Při nákupu disků pro RAID5 obvykle berou minimálně 3 disky (nejspíše kvůli ceně). Pokud náhle po čase dojde k poruše některého z disků, pak může nastat situace, kdy nebude možné zakoupit podobný disk jako používaný (již se nevyrábí, dočasně není skladem apod.). Zajímavějším nápadem se proto zdá být nákup 4 disků, uspořádání RAID5 ze tří a připojení 4. disku jako zálohy (pro zálohy, jiné soubory a další potřeby).

Objem diskové pole RAID5 se vypočítá pomocí vzorce (n-1)*hddsize, kde n je počet disků v poli a hddsize je velikost jednoho disku. Například pro pole 4 disků po 80 gigabajtech bude celkový objem 240 gigabajtů.

Nabízí se otázka „nevhodnosti“ RAID5 pro databáze. Minimálně se na to lze dívat z pohledu, že za účelem získání statku Výkon RAID 5, musíte použít specializovaný řadič, a ne výchozí na základní desce.

Článek RAID-5 musí zemřít. A více o ztrátě dat na RAID5.

Poznámka. Od 09.05.2005 náklady na SATA Disk Hitachi 80 GB je 60 dolarů.

RAID 10, 50

Dále následují kombinace uvedených možností. Například RAID 10 je RAID 0 + RAID 1. RAID 50 je RAID 5 + RAID 0.

Zajímavé je, že kombinace RAID 0+1 vychází z hlediska spolehlivosti hůře než RAID5. Služba opravy databáze má případ selhání jednoho disku v systému RAID0 (3 disky) + RAID1 (3 další stejné disky). Současně RAID1 nemohl „zvednout“ záložní disk. Ukázalo se, že základna je poškozená bez jakékoli šance na opravu.

RAID 0+1 vyžaduje 4 disky a RAID 5 vyžaduje 3. Přemýšlejte o tom.

RAID 6

Na rozdíl od RAID 5, který používá paritu k ochraně dat proti jednotlivým chybám, RAID 6 používá stejnou paritu k ochraně proti dvojitým chybám. V souladu s tím je procesor výkonnější než v RAID 5 a jsou vyžadovány ne 3, ale alespoň 5 disků (tři datové disky a 2 paritní disky). Navíc počet disků v raid6 nemá stejnou flexibilitu jako v raidu 5 a musí se rovnat jednoduchému číslu (5, 7, 11, 13 atd.)

Řekněme, že selžou dva disky současně, ale takový případ je velmi vzácný.

Neviděl jsem žádné údaje o výkonu RAID 6 (nedíval jsem se), ale může se stát, že kvůli redundantnímu ovládání může být výkon na úrovni RAID 5.

Čas přestavby

Každé pole RAID, které zůstane funkční, pokud selže jeden disk, má svůj koncept čas na obnovu. Samozřejmě, když vyměníte mrtvý disk za nový, řadič musí organizovat fungování nového disku v poli a to nějakou dobu potrvá.

Při „připojování“ nového disku, například pro RAID 5, může řadič povolit provoz pole. Rychlost pole však v tomto případě bude velmi nízká, přinejmenším proto, že i když je nový disk „lineárně“ zaplněn informacemi, zápis na něj bude „odvádět pozornost“ řadiče a hlav disku od synchronizace operací se zbytkem disku. disky pole.

Doba potřebná k obnovení normálního provozu pole přímo závisí na kapacitě disku. Například pole Sun StorEdge 3510 FC Array s velikostí pole 2 terabajty v exkluzivním režimu provede přestavbu do 4,5 hodiny (při ceně hardwaru asi 40 000 $). Proto při organizování pole a plánování obnovy po havárii musíte především myslet na čas obnovy. Pokud vaše databáze a zálohy nezabírají více než 50 gigabajtů a nárůst za rok je 1–2 gigabajty, pak má sotva smysl sestavovat pole 500 gigabajtů disků. 250 GB bude stačit a i pro raid5 to bude minimálně 500 GB prostoru pro umístění nejen databáze, ale i filmů. Ale doba přestavby u 250GB disků bude přibližně 2krát kratší než u 500GB disků.

Resumé

Ukazuje se, že nejsmysluplnější je použít buď RAID 1 nebo RAID 5. Nejvíce však běžná chyba, což téměř každý dělá, je používat RAID „na všechno“. To znamená, že nainstalují RAID, naskládají na něj vše, co mají, a... získají v nejlepším případě spolehlivost, ale žádné zlepšení výkonu.

Zápisová mezipaměť také často není povolena, v důsledku čehož je zápis na raid pomalejší než zápis na běžný jeden disk. Faktem je, že pro většinu ovladačů je tato možnost ve výchozím nastavení zakázána, protože... Má se za to, že aby to bylo možné, je žádoucí mít na raid controlleru alespoň baterii a také přítomnost UPS.

Text
Starý článek hddspeed.htmLINK (a doc_calford_1.htmLINK) ukazuje, jak můžete dosáhnout výrazného zvýšení výkonu použitím více fyzických disků, dokonce i pro IDE. Pokud tedy uspořádáte RAID, umístěte na něj základnu a zbytek (temp, OS, virtuální disk) udělejte na jiných pevných discích. Koneckonců, samotný RAID je jeden „disk“, i když je spolehlivější a rychlejší.
prohlášeno za zastaralé. Vše výše uvedené má právo existovat na RAID 5. Před takovým umístěním však musíte zjistit, jak můžete zálohovat/obnovit operační systém a jak dlouho to bude trvat, jak dlouho bude trvat obnovení „ mrtvý“ disk, zda existuje (bude) ) je po ruce disk, který nahradí „mrtvý“ a tak dále, tj. budete muset předem znát odpovědi na nejzákladnější otázky pro případ selhání systému .

Stále doporučuji ponechat operační systém na samostatném disku SATA, nebo chcete-li, na dvou discích SATA připojených v RAID 1. V každém případě umístění operačního systému na RAID musíte naplánovat své akce, pokud se základní deska náhle zastaví pracovní deska - někdy je přenos disků raid pole na jinou základní desku (čipset, raid řadič) nemožný z důvodu nekompatibility výchozích parametrů raidu.

Umístění základny, stínu a zálohy

Přes všechny výhody RAID se striktně nedoporučuje například zálohovat na stejný logický disk. Nejen, že to má špatný vliv na výkon, ale také to může vést k problémům s nedostatkem volného místa (u velkých databází) - vždyť v závislosti na datech může být záložní soubor ekvivalentní velikosti databáze , a ještě větší. Vytvoření zálohy na stejný fyzický disk je stále v pořádku, i když nejvíce nejlepší možnost- zálohování na samostatný pevný disk.

Vysvětlení je velmi jednoduché. Zálohování je čtení dat z databázového souboru a zápis do záložního souboru. Pokud se toto vše fyzicky odehrává na jednom disku (dokonce i v RAID 0 nebo RAID 1), bude výkon horší, než při čtení z jednoho disku a zápisu na jiný. Výhoda z tohoto oddělení je ještě větší, když se zálohování provádí v době, kdy uživatelé pracují s databází.

Totéž platí pro stín - nemá smysl dávat stín například na RAID 1 na stejné místo jako základna, dokonce i na jiné logické disky. Pokud je přítomen stín, server zapisuje datové stránky do databázového souboru i do stínový soubor. To znamená, že místo jedné operace zápisu se provedou dvě. Při rozdělení základny a stínu na různé fyzické disky Výkon zápisu bude určen nejpomalejším diskem.

Tento článek připravil Nikolaj Vedyashkin, odborník ze servisního střediska Jet Infosystems.

Představme si situaci: na databázový server jsme přidali novou instanci databáze nebo novou zálohovací úlohu (BK), připojili další server k diskovému poli a ve všech těchto případech jsme zjistili pokles jeho výkonu. Pak můžete jít různými způsoby.

Například přidejte databázový server a přeneste na něj instanci databáze, přidejte záložní jednotky pro urychlení ukládání dat, upgradujte procesory atd. Je však třeba připomenout, že pouhé zvýšení kapacity hardwaru je z hlediska materiálových a časových nákladů nejméně ziskové. Mnohem efektivnější je takové problémy řešit na úrovni logiky IT řešení.

Příčiny uklouznutí

Problémy s výkonem pole jsou často způsobeny tím, že počáteční konfigurace nebere v úvahu jeho architekturu, provozní principy a stávající omezení. Například Achillovou patou polí starší generace je poměrně nízká propustnost interních sběrnic – cca 200 Mb/sec. Před nedávnem nás jeden ze zákazníků požádal o analýzu výkonu jeho diskového pole a doporučení pro optimalizaci. Pole ve skutečnosti nebylo načteno a jeho rychlost pravidelně zůstávala nedostatečná. Analýza odhalila nesprávnou konfiguraci: obecně platí, že během dne byly interní disky zatěžovány přibližně stejně, ale zátěžové špičky na nich byly rozloženy nerovnoměrně. V důsledku toho došlo k přetížení jedné z interních sběrnic. To znamená, že pole „proklouzlo“ kvůli překročení maximálního přípustného prahu pro jeden komponent. Naše doporučení – přerozdělení, aby se vnitřní pneumatiky zatížily rovnoměrně – pomohlo zvýšit produktivitu o 30 %.

Chyba se také může vloudit při připojování serverů k úložným systémům. Příkladem je nesprávná konfigurace kapacity disku, která je prezentována hostitelům. Faktem je, že některá z moderních polí mají omezení na takový parametr, jako je fronta příkazů (Queue Depth, QD). Zde stojí za to jít trochu hlouběji do historie. Ve standardu SCSI-I musel ovladač serveru SCSI čekat na dokončení jednoho příkazu, než odeslal další. Od standardu SCSI-II a vyššího může ovladač SCSI posílat na disk SCSI několik příkazů (QD) současně. Maximální množství paralelně obsluhované příkazy SCSI jsou jednou z nejdůležitějších vlastností disku. Parametr IOPS (Input Output Operation per Second) ukazuje, kolik požadavků (SCSI příkazů) za sekundu je SCSI LUN schopna provést. Ukazuje se, že QD a IOPS se mohou dostat do nesmiřitelného vzájemného konfliktu.

Je docela možné, že I/O charakteristiky na straně serveru jsou nepřijatelné, doba odezvy na požadavky je velmi dlouhá a pole není načteno. Důvod spočívá v - nesprávné konfiguraci fronty příkazů (vyšší než přípustné) - příkazy visí ve vyrovnávací paměti pole, dokud na ně nepřijde řada k provedení. Velké servisní časy jsou zaznamenány na serveru.

Pokud je QD výrazně nižší než optimální hodnota, utrpí tím i výkon. S vynikající dobou odezvy a nezatíženým polem bude počet požadavků, které zpracovává, velmi malý. Důvodem je dlouhé čekání ve frontě před odesláním požadavků do úložného systému.

Chytání IOPS za ocas

Co dělat, pokud je doba odezvy mimo grafy a pole není načteno? Nebo pokud chcete jen „vymáčknout“ z pole trochu více?
Může:

podívejte se do nastavení Queue Depth na serveru a porovnejte maximální povolenou frontu příkazů s LUN pole. Upravit nastavení;
podívejte se na statistiky z pole. Možná se na něm hromadí fronta příkazů pro LUN;
rozdělit jednu LUN na několik a připojit ji k hostiteli v pruhu nebo alespoň ve zřetězení, v závislosti na konfiguraci. Zřetězení je užitečné, pokud je zatížení distribuováno mezi všechny logické jednotky.
zvolte velikost prokládané jednotky na poli a hostiteli tak, aby typická operace aplikace načetla co nejméně fyzických disků v poli.

Rýže. 1. Velikost jednotky pruhu

Příklad z naší zkušenosti: kombinace server-pole zákazníka nevykazovala deklarovanou úroveň výkonu. V důsledku analýzy se ukázalo, že server dostal velmi velký (několik terabajtů) LUN - výkon aplikací byl neuspokojivý a samotný LUN byl přetížen frontou příkazů. Doporučujeme tuto LUN rozdělit na několik a rozložit typy zátěže napříč různé objemy. Na serveru se otáčely 4 instance databází, v důsledku toho jedna z nich začala pracovat 6krát rychleji, druhá - 2krát rychleji.

Více není lepší

Zákazníci IT profesionálové ne vždy chápou, který typ RAID je pro daný profil zatížení aplikace nejvhodnější. Každý ví, že RAID 10 je spolehlivý, odolný vůči vícenásobným ztrátám na disku a ukazuje se dobrá rychlost na náhodné operace. Není divu, že tato velmi drahá možnost je nejčastěji vybírána. Pokud však profil zatížení aplikace zahrnuje několik operací náhodné nahrávání a mnoha operacích čtení nebo sekvenčního zápisu je optimální použít RAID 5. Na stejném počtu disků může pracovat 1,5x nebo i 2x rychleji. Oslovila nás společnost, abychom zlepšili výkon diskových I/O jedné z jejích aplikací. Aplikace generovala mnoho čtení a málo zápisů. Na poli byl nakonfigurován RAID 10 a ze statistik bylo zřejmé, že téměř polovina disků v RAID skupině byla nečinná. S přechodem na RAID 5 z přesně stejného počtu fyzických disků se výkon aplikace zlepšil více než 1,5krát.

Uvítáme vaše konstruktivní připomínky.

Problémy s výkonem se týkají téměř každé společnosti, která provozuje výpočetní systém. Zde uvedené příklady nejsou jediné. Mnoha problémům spojeným se špatným výkonem polí lze předejít, pokud se při konfiguraci zařízení vezme v úvahu architektura a profil zatížení aplikace. Zároveň by se zlepšování výkonu výpočetního systému nemělo omezovat na žádnou z jeho součástí – server, pole, software nebo datovou síť. Nejlepší výsledky lze dosáhnout po analýze celého komplexu jako celku a změně konfigurace nejen pole, ale i serveru a aplikací.

Nadšenci budou pravděpodobně vědět, jak tyto kroky provést, ale pro ty, kteří se s poli teprve chystají seznámit, může být takový materiál užitečný. Ať mi příznivci AMD prominou, vysvětlím na příkladu výše zmíněného stojanu Wintelidia.

Nejprve je potřeba v BIOSu přepnout provozní režim řadiče čipové sady do režimu RAID.

Pokud dojde k přepnutí po instalaci operačního systému, je to spojeno se ztrátou jeho funkčnosti a nekonečným pádem na modrou obrazovku. Chcete-li tento problém vyřešit, měli byste použít pokyny společnosti Microsoft.

Předpokládejme, že je s tím vše v pořádku. Pokud OS ještě není nainstalován, můžete vstoupit do nabídky samotného ovladače a vytvořit pole v jeho utilitě. Chcete-li to provést, musíte mít čas během načítání stisknout CTRL+I.

Pokud je možné bootovat ze samostatného disku, nejjednodušší je nainstalovat proprietární ovladače Intel a použít konzolu Rapid Storage Technology. V závislosti na dostupnosti vhodné disky K dispozici bude tlačítko „Vytvořit“.

Prvním krokem je výběr typu pole.

Poté proveďte nastavení přímo. Je možné nevytvářet RAID od začátku, ale jako základ použít jeden disk s daty. Navíc u všech polí (kromě „zrcadlení“) můžete vybrat velikost datového proužku, známou také jako velikost proužku. To určuje velikost bloků, do kterých jsou data rozdělena. Velké hodnoty jsou užitečné pro práci s velkými soubory, malé - především pro malé transakce ve stylu DBMS (ačkoli vše velmi závisí na DBMS, typu pole, typu zatížení, náladě vývojářů firmwaru ovladače a dalších funkce). Obvykle je nejlepší ponechat výchozí nastavení.

Můžete také povolit mezipaměť odepsat hlasitost, která je ve výchozím nastavení zakázána. V tomto případě se data zapsaná do pole neodesílají okamžitě na disky, ale dočasně se ukládají do mezipaměti (u řadiče čipové sady je to BERAN počítač).

To zvyšuje rychlost operací zápisu, ale zároveň zvyšuje riziko ztráty dat v případě selhání. Všichni děláme „zálohy“ (opravdu???) a očekáváme RAID-0 maximální výkon, takže ve všech testech těchto polí bude mezipaměť povolena.

Můžete také spravovat mezipaměť samotných disků v poli. Ve výchozím nastavení je povoleno. U RAID-1 bude měření výkonu prováděno bez mezipaměti, protože pokud jde o spolehlivost, již nedosahuje vysokých rychlostí.

Mimochodem, scénář není tak exotický. Windows Server, jako řadič domény, vždy zakáže mezipaměť systémového disku. Pokud není diskrétní řadič RAID a který se řídí pouze svým ovladačem, rychlost pevných disků několikrát klesne. Pojďme se podívat, jak se SSD disky chovají.

V mém případě vypnutí mezipaměti přes Intel RST z nějakého důvodu nefungovalo - po restartu se znovu zapnul. Musel jsem použít „Správce zařízení“, konkrétně zrušit zaškrtnutí políčka „Povolit ukládání položek do mezipaměti pro toto zařízení“ ve vlastnostech pole RAID.

Toto nastavení a Intel RST jsou propojeny po odškrtnutí možnosti „Disk Data Cache“ také přejde do stavu „Off“ a zůstane tak i po restartu.

V důsledku toho budou testovány následující konfigurace:

Vertex 3 RAID-0, velikost pruhu 32 KB;
Vertex 3 RAID-0, velikost pruhu 128 KB;
Vertex 3 RAID-0, připojení přes porty SATA-II;
Vertex 3 RAID-0, pomalý CPU (dvě jádra aktivní, HT vypnuto, 2400 MHz, 1066 MHz CL7 paměti);
Vertex 3 RAID-1, mezipaměť pole a disku povolena;
Vertex 3 RAID-1, mezipaměť pole a disku zakázána;
Crucial M4 RAID-0, velikost pruhu 32 KB;
Crucial M4 RAID-1, povolená mezipaměť pole a disku;
Crucial M4 RAID-1, pole a disková mezipaměť vypnuta;
Single Vertex 3;
Single Crucial M4;
Pevný disk WD5000AAKX.

Testování v klasických benchmarcích

Značka krystalového disku

Lineární rychlost čtení, MB/s

Téměř dvojnásobné zvýšení rychlosti v RAID-0 se celkem očekává. Velikost pruhu nemá prakticky žádný vliv na velké soubory a benchmark není závislý na procesoru. Ale připojení SATA-II prudce omezuje možnosti systému na úroveň jediného zařízení připojeného přes SATA-III.

RAID-1 pracuje úžasně rychle, čte ze dvou disků současně. Dříve v tvrdé zkoušky Na discích to nebylo pozorováno, ale šlo o starší platformu a starší ovladače. V případě potřeby budete muset zkontrolovat několik pevných disků. Lineární rychlost záznamu, MB/s